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DESCRIZIONE DELL' INVENZIONE INDUSTRIALE dal titolo: 
"POLINUCLEOTIDE SINTETICO COD I F I CANTE PER LA 
LATTOFERRINA UMANA, VETTORI , CELLULE E PI ANTE 
TRANSGENI CHE CHE LO CONTENGONO" 
della ditta italiana PLANTECHNO S.r.l. 
con sede in CAS ALMAGGI ORE (CREMONA) 

<><><><><><><> 
DESCRIZIONE 
Camno de 1 1 ' i nven z i one 

La presente invenzione si riferisce al campoN ^jtl'^ . 
biotecnologie vegetali, ed in particolare alle 
tecniche ed ai sistemi di trasf ormazione di piante 
e cellule vegetali, alle cellule e piante 
transgeniche cosi generate, ed al loro utilizzo. 
Stato dell 'arte 

L ' utilizzazione di piante genet icamente 
modificate e progress ivamente aumentata negli 
ultimi anni, in conseguenza della grande varieta. di 
applicazioni derivate dallo sf ruttamento delle 
tecniche dell ' ingegneria genetica nella biologia 
dei vegetali. 

In particolare una notevole importanza pratica 
ha assunto lo sviluppo di tecniche per la 
trasf ormazione delle piante in organismi capaci di 
produrre proteine di interesse commerciale . 



0 , 




2 




r 



-■» 



La 



generazione 



di 



piante 



ricombinanti 



contenenti un gene eterologo di interesse, e la 
loro utilizzazione in procedimenti di produzione su 
scala industriale, consente infatti di superare una 
serie di inconvenienti che caratterizzano i sistemi 
di produzione attualmente in uso ed in particolare 
quelli basati su colture cellulari. 

La tecnologia del DNA ricombinante ha 
consentito infatti la generazione di cellule 
transgeniche che vengono utilizzate per la 
produzione di proteine eterologhe di interesse. In 
particolare le colture di cellule animali e 
specif icamente di mammifero, consentono di produrre 
proteine di interesse anche estremamente complesse 
nella forma nativa, ma il relativo procedimento e 
estremamente dispendioso, dato che sono necessari 
centinaia di litri di cellule per la produzione di 
una quantita di proteine sufficiente per un uso 
commerciale (ad esempio f armacologico o alimentare) 
(Stowell et al., 1991). 

Un' alternativa in questo senso e data allora 
dalla produzione realizzata in colture di cellule 
procariotiche, un procedimento piu economico che 
perd incontra un limite import ante nella incapacity 
di questi sistemi di operare le modifiche post- 
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trascrizionali e traduzionali necessarie per la 
espressione di proteine eterologhe complesse, che 
solo i sistemi eucariotici sono in grado di 
effettuare (Glick e Pasternak, 1994) . 

Una soluzione £ stata quindi ricercata nella 
trasf ormazione di sistemi eucariotici complessi, in 
grado di garantire la produzione di proteine 
attive, con procedimenti al contempo economici 
(Watson et al . 1992) . 

Le piante, in particolare, possiedono le 
potenzialita necessarie, e la loro capacita di 
fungere da bioreattori per la produzione di 
proteine complesse (le piante sono molto efficienti 
in questo tipo di processi e garantiscono una 
gualita di espressione elevata) , in modo economico 
(la coltivazione delle piante e relativamente poco 
dispendiosa) e con un elevato rendimento (da 
ciascun singolo raccolto possono esser ottenute 
elevate guantita di proteine) e stata dimostrata 
(Fraley e Schell, 1991) . 

Inoltre moltissime piante, rispondono 
positivamente all ' import ante requisito della non- 
allergenicita richiesto per i sistemi di produzione 
di proteine ricombinanti di interesse f armacologico 
o alimentare. Gli organismi utilizzati in queste 



produzioni devono infatti appartenere alia 
categoria degli organismi GRAS (Generally- 
Recognised As Safe) , cioe organismi che in guanto 
utilizzati da lungo tempo dall'uomo, sono 
considerati sicuri sia per l'uomo che per 
1 ' ecosistema . Piante come le leguminose, i cereali, 
il tabacco, le orticole in genere e gli alberi da 
frutto, soddisfano naturalmente questo requisite 
Tra le leguminose particolare interesse riveste la 
soia, alimento base della dieta di molte 
popolazioni, soprattutto dei paesi del terzo mondo, 
ma di recente anche dei paese europei . Composti 
derivati dalla soia costituiscono infatti 
ingredienti presenti in moltissimi alimenti, come 
ad esempio la lecitina e l'olio di semi, mentre dai 
semi di questa leguminosa si ricava una farina che 
viene utilizzata in diverse formulazioni 
alimentari, come ad esempio il latte di soia che ne 
contiene circa I 7 8%. 

In questo senso le piante, pur essendo 
utilizzabili come materia prima dalla quale pud 
essere est rat to il prodotto secondo i procedimenti 
convenzionali, costituiscono contemporaneamente 
un' alternativa alia produzione convenzionale . Esse 
infatti possono essere utilizzate come cibi 
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funzionali, cibi cio£ modificati genet icamente 
modo da essere arricchiti da un punto di v 
nutrizionale e assuraere, se del caso, importa 
propriety di farmaco naturale. 

In questo modo viene eliminato il passaggio 
della estrazione della proteina dalla pianta, e la 
espressione della proteina eterologa non prelude ad 
una sua estrazione e purif icazione, passaggi da cui 
deriva gran parte del costo di produzione di un 
farmaco, ma va semplicemente ad arricchire un 
alimento vegetale, che diviene cosi un 
nutraceutical cioe un nutrimento con valenza 
f armacologica . 

Da cio si comprendono gli sforzi compiuti 
dalla ricerca per la generazione di piante 
geneticamente modificate, ottimizzate per le 
applicazioni su menzionate. 

La valutazione della capacita di espressione 
eterologa caratteristica di varie specie di piante 
e stata fino ad oggi perd realizzata esclusivamente 
in laboratorio o comunque su superfici 
relativamente limitate in serra . 

Ad esempio e stata analizzata la espressione 
in pianta dell ' encef alina e dell ' albumina sierica 
umana, cosi come anche oggetto di studi e stata 
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1 ' espressione in pianta di anticorpi monoclonali di 
topo (Watson et al . , 1992). Piii recentemente , 
sempre in riferimento a proteine rilevanti dal 
punto di vista f armacologico, altre due proteine 
umane di importanza terapeutica, 1 ' interleuchina-6 
attiva e la proteina C (un anticoagulante del 
siero) , sono state espresse con successo in 
tabacco. In tutti questi casi la pianta modello su 
cui si verifica la funzionalita del gene preparato 
e il tabacco, mentre la pianta finale scelta per la 
produzione solitamente e una leguminosa, il cui 
seme e ricco di proteine di riserva. 

Tali esperimenti hanno dimostrato che spesso i 
livelli di espressione della proteina eterologa nei 
bioreattori vegetal i non raggiungono valor i 
sufficienti per rispondere alle esigenze 
commerciali e che comunque questi possono essere 
migliorati applicando le nuove informazioni sulla 
regolazione genica delle piante. Si e dimostrato 
in particolare che, per essere economicamente 
signif icativo il livello di proteina ricombinante 
prodotta deve raggiungere valori superiori all'1% 
del contenuto proteico totale, livello naturalmente 
non raggiunto in seguito alia semplice introduzione 



del gene eterologo, la cui espressione deve essere 
quindi massimizzata.. 

In relazione alia biologia della cellula 
vegetale, per operare la massimizzazione del 
livello di espressione in pianta occorre agire su 
vari piani : aumento della trascrizione genica, 
aumento della stabilita del trascritto e della resa 
del processo di traduzione. £' necessario inoltre 
fissare il gene introdotto e minimizzare il rischio 
del manif estarsi di fenomeni di silenziamento 
(^silencing") o disattivazione genica. Tutti questi 
fattori sono decisivi nel determinare il livello di 
espressione del gene eterologo in pianta, la quale, 
come si e detto, al. di la di alcune eccezioni in 
genere si assesta su livelli piuttosto bassi (Owen 
e Pen, 1996) . 

Tra tutti questi, il fattore piu importante, 
assieme al livello di trascrizione dipendente dalla 
presenza pref erenziale di certi codoni, sembrerebbe 
essere la stabilita della proteina ricombinante 
nell'ospite eterologo, probabile causa della loro 
facile eliminazione . La relativa instability 
potrebbe essere conseguente, da una parte alia 
incapacity della proteina eterologa. tradotta di 
assumere una conf ormazione strutturale stabile. 



dall'altra anche al compart imento subcellulare in 
cui essa viene indirizzata successivamente alia 
traduzione, dove la presenza di proteasi e 
particolari valori di pH ne determinano la 
degradazione . 

In questo senso, e guindi importante sia 
prowedere alia modifica delle sequenze eterologhe 
in modo da garantire 1 ' ottimizzazione dei codoni 
che anche operare una attenta selezione delle 
sequenze di "targeting", capaci di indirizzare la 
proteina tradotta in comparti subcellulari 
pref erenziali, come per es. i tessuti di riserva 
del seme, in grado di garantire la stabilita del 
prodotto. In relazione a quest" ultima 

considerazione, la migliore strategia di azione in 
questo senso, e quel la che prevede il mantenimento 
delle sequenze segnale (denominate da qui in avanti 
anche "leader") endogene della pianta scelta per la 
produzione finale. L'adozione di tali sequenze 
evita infatti, la alterazione dell ' equilibrio 
cellulare interno, conseguente all ' inevitabile 
accumulo disordinato di proteine esogene che si 
verif icherebbe in loro assenza. A questo riguardo 
inoltre d necessario tenere conto del fatto che i 



compart imenti subcellulari assumono caratteristiche 
differenti nelle cellule dei vari tessuti. 

Le proteine eterologhe accumulate assieme alle 
proteine di riserva dei semi, nelle piante 
transgeniche, sono ad esempio molto piu stabili 
rispetto a quelle degli organi vegetativi (Owen e 
Pen, 1996) . La ragione di tale differente stability 
risiede probabilmente nelle differenti attivita 
proteasiche registrate nei vacuoli delle cellule 
del meristema fogliare, rispetto a quelle 
registrate nei vacuoli dei semi. E' comprensibile 
quindi che gli sforzi siano concentrati verso la 
generazione di piante transgeniche in cui la 
proteina eterologa sia espressa pref eribilmente ney^ 
seme (Owen e Pen, 1996) . 

II seme inoltre rappresenta l'organo vegeta 
in assoluto piu utilizzato dall'uomo per la 
facilita di conservazione e, owiamente, per 
l'apporto calorico e proteico. II seme consiste 
nell' embrione della pianta awolto da tessuti di 
riserva che forniscono energia ed azoto durante la 
germinazione . Normalmente e l'endosperma ad avere 
prevalentemente la funzione di tessuto di riserva, 
ma nei legumi, come per esempio la soia, i 




cotiledoni si sviluppano notevolmente ed 
acquisiscono questa funzione. 

La funzione di riserva, per la componente 
azotata, viene svolta da proteine particolari 
accumulate nei corpi proteici, all 7 interne- di 
compart imenti . nei sistemi di endomembrane 
cellulari. La quantita di proteine presenti nei 
seme varia da circa il 10-15% nei cereali a circa 
il 25-35% nelle leguminose, per cui i semi sono 
una fonte importante di proteine per la dieta umana 
(Shewry et al . , 1995). 

Al fine di sfruttare il sistema di espressione 
delle proteine di riserva del seme e necessario 
considerare in via preliminare che le proteine di 
riserva di tutti i vegetali sono accomunate da 
alcune caratteristiche funzionali e f isiologiche : 
la loro sintesi e regolata in base alle esigenze 
nutrizionali durante la maturazione del seme e sono 
conservate in corpi proteici. Le proteine di 
riserva delle leguminose sono in particolare divise 
in due classi: globuline e lectine. Le globuline 
sono le proteine di riserva piu diffuse, essendo 
presenti non solo nelle leguminose, ma anche nelle 
monocotiledoni e in altre dicot iledoni . La classe 
delle globuline a sua volta e divisa in due 



sottoclassi: le legumine (proteine esameriche lis) 
e le viciline (proteine trimeriche 7S) . Alia 
sottoclasse delle viciline appartengono anche le 
proteine p-conglicinina e globulina basica 7S, i 
cui elementi di regolazione sono stati utilizzati 
per realizzare la espressione tessuto specifica nel 
seme (Shewry et al . , 1995), ma mentre il primo e 
stato studiato in dettaglio, per la globulina 
basica non si hanno informazioni dettagliate sul 
suo f unzionamento . 

La p-conglicinina e una proteina di riserva 
del seme di soia (Glycine max) , composta da tre 
subunita diverse, or, a*, p, che interagiscono non 
covalentemente formando un complesso trimerico. Le 
subunita sono codificate da una famiglia 
multigenica di 15 geni raggruppati in sei region! 
del DNA nucleare, la cui espressione e strettamente 
regolata in modo da essere modulata durante la vita 
della pianta (Harada et at. 1989). La regolazione e 
del tipo sia stadio specifica che tessuto 
specifica. La espressione di ciascuna subunita 
infatti, viene attivata a livelli elevati al 
momento dello sviluppo dell ' embrione, dalla fase a 
cuore fino alia maturazione completa, mentre prima 
della fase di dormienza viene repressa. 



Inoltre 1 ' espressione awiene solo in zone 
specif iche della pianta, quali i cotiledoni, 
secondo un "pattern" di espressione che varia nel 
corso della loro maturazione ; dapprima viene 
attivata nella zona cotiledonare esterna, poi si 
registra una distribuzione ad onda dall'esterno 
verso l'interno ed infine risulta diffusa 
unif ormemente in tutto il tessuto cotiledonare. II 
gene per la P-conglicinina si esprime comunque 
anche nell'asse embrionale, durante la fase a cuore 
(18 giorni dopo 1 ' impollinazione) , mentre non si 
esprime nell ' endosperma, nei tegumenti e nei 
tessuti gia dif f erenziati (Perez-Grau e Goldberg, 
1989) . Lo stesso comportamento si verifica anche 
nel seme di piante transgeniche appartenenti ad 
altre famiglie, come per esempio il tabacco, 
confermando che lo stesso meccanismo di regolazione 
e funzionale anche nelle solanaceae (Naito et al . 
1988; Perez-Grau e Goldberg, 1989) . 

La regolazione dell ' espressione genica delle 
subunita a/cc x e J5 awiene sia a livello 
trascrizionale che post-trascrizionale (Harada et 
al . / 1989). La subunita ct x , di 76 Kd, con un mRNA 
di 2,5 Kb, viene accumulata piii precocemente ed in 
quantita maggiore della subunita p. Questo 
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comport amento e dovuto alia maggior forza del 
promotore della subunita a' dovuto alia presenza di 
una regione enhancer, assente in (3, e di una 
sequenza che stabilizza il trascritto di a' , 
anch'essa assente in P (probabilmente una regione, 
di 560 pb nel primo esone del trascritto di <xp 0 
(Harada et al . , 198.9). Questa differenza |^i 
espressione e stata evidenziata anche in piante xTi' 
tabacco trasformate (Bray et al . , 1987). 

Il livello di espressione della subunita p, a 
differenza della subunita a' , e anche influenzato 
da stress abiotici, dal livello di metionina nel 
terreno e da presenza di ABA. Gli element i 
fondamentali implicati nella regolazione a livello 
trascrizionale del gene per la subunita a' sono 
raccolti nella regione di 905 pb in 5' rispetto al 
sito di inizio della trascrizione, regione detta 
URS (Upstream Regulatory Sequence) . All'interno di 
questa zona sono state individuate sequenze 
specif iche con funzione di enhancer sito-specif ico. 
Fra queste vi sono i legumin boxes (5 ' -CATGCAC . 3 •' e 
5' -CATGCAT-3 ' ) / elementi che si ritrovano in molti 
altri geni per proteine seme-specif iche, in 
particolare nei legumi . L'azione coordinata delle 
due sequenze determina un aumento di circa 10 volte 




del livello di espressione del gene nel seme. La 
regolazione da parte di questi elementi sembra 
essere di tipo positivo (Chamberland et al . 1992), 
ma non sono stati ancora trovati elementi trans che 
interagiscano specif icamente in questi siti. 

L' espressione sito-specif ica necessita anche 
dell'azione coordinata di elementi che agiscono in 
cis, che non sono ancora stati caratterizzati, 
situati nella regione in 5' rispetto ai "legumin 
boxes" e nella zona 3' del promotore (Chamberland 
et al . , 1992). La zona in 5' contiene probabilmente 
un sito di regolazione negativa, specif ico per un 
fattore nucleare presente solo in tessuti non-seme. 
Questo fattore determinerebbe 1 ' espressione del 
gene solo in tessuti embrionali. E' stata 
dimostrata anche l'importanza delle sequenze CAAT e 
TATA nella regolazione della sito-specif icita . 

Sono stati identificati anche quattro fattori 
nucleari di soia che interagiscono con sequenze 
specif iche presenti nella URS del gene per a' e p. 
Due di questi fattori embrionali, SEF3 e SEF4, si 
legano in siti all'interno della regione enhancer 
(da -257 a -79 ) . SEF3 si lega al centro della 

sequenza 5 ' -AACCCA AACCCA-3', presente solo 

nel gene per la subunita a' . L'accumulo e la 



degradazione di questa proteina (SEF3) viaggia 
parallelamente all'accumulo e alia degradazione 
dell'mRNA di a', supportando l'ipotesi che SEF3 sia 
implicato nella regolazione dell ' espressione di a' . 
SEF4 e un fattore presente in quantita minore di 
SEF3 , ha molti siti di riconoscimento (5'- 
A/GTTTTTA/G-3 ' ) in a', ma soprattutto in p. La 
presenza di questo fattore e correlata con la 
regolazione dell ' espressione di p (Lessard et al . , 
1991) . Esperimenti di delezione e mutagenesi sito- 
specifica hanno dimostrato. che l'azione di questi 
fattori da soli non influisce n£ sulla sito- 
specificita, n§ sul livello di espressione, occorre 
infatti la coordinazione con l'attivita degli altri 
elementi regolatori . Si pensa coraunque che queste 
proteine abbiano un ruolo di regolazione solo in 
certe condizioni, in base alia omologia con 
proteine indotte dalla luce {Fujiwara e Beachy, 
1994) . 

Fattori embrionali con comport amento simile a 
SEF3, verificato in esperimenti di gel shift, sono 
stati trovati anche in tabacco (Lessard et al . , 
1991) . Questo ed altri dati ottenuti con saggi 
dell ' attivita glucuronidasica (GUS) sotto il 
control lo del promotore a' di soia, dimostrano che 



il meccanismo di regolazione sito- e stadio- 
specifico e conservato (Lessard et al, 1991; Riggs 
et al . , 1989) . Si pensa anche che fattori trans in 
tabacco che si leghino al promotore 35SCaMV, 
possano interagire anche con i legumin boxes 

(Katagiri et al . , 1989). Nessuno dei fattori finora 
citati risulta essere direttamente responsabile 
del la regolazione temporale, non si e trovato un 
fattore NRS -simile che abbia una regolazione 
negativa come in fagiolo (Bustos et al . 1991). 

Studi piu recenti, riguardanti alcune legumine 
e viciline in Vicia faba, smentiscono alcune 
generalizzazioni fatte sulla regolazione 

dell ' espressione delle proteine di riserva dei semi 

(Wobus et al . , 1995). Essi dimostrano che i geni 
delle legumine B4 e LeB4 di Vicia faba non sono 
espressi solo in tessuti embrionali, ne" sono 
temporalmente ristretti alia fase di espansione 
cellulare durante 1 ' embriogenesi . Le proteine sono 
accumulate per brevi period! e poi degradate in 
tutti i tessuti embrionali, compreso il sospensore 
e 1 ' endosperma, in precisi stadi di sviluppo. 
Questo probabilmente per permettere un rifornimento 
continuo all'embrione di composti ricchi di C e N 
durante tutte le fasi di crescita e di 



dif f erenziamento . Quest i dati quindi fanno 
ipotizzare che 1 ' espressione delle proteine dei 
semi sia regolata anche metabolicamente e non solo 
a livello di fasi di sviluppo. Si sta ora indagando 
sulla possibile relazione fra accumulo di proteine 
di riserva e metabolismo dei. carboidrati (livello 
di zuccheri solubili) . Poiche tutte le classi di 
proteine di riserva dei semi hanno un comportamento 
simile nelle varie specie, questi dati richiedono 
una attenta valutazione del comportamento, in 
termini di espressione, anche per le proteine di 
soia p-conglicinina e globulina basica 7S. Dai dati 
ricavati dal lavoro riportato in questa invenzione 
risulta evidente la specificita tissutale 
dell ' espressione della parte strutturale. della 
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lattoferrina sotto controllo di entrambi^P, a? 
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perche interessava solo la capacita di accum\ilo,"; 
totale nel seme. Per quanto riguarda in 
particolare la globulina basica 7S, essa e una 
proteina di riserva del seme di soia ricca di 
metionina e cisteina. Come la p-conglicinina, anche 
la globulina basica 7S (Bg) e accumulata nel seme 
in grandi quantita (3% delle proteine totali del 
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seme) . E' costituita da due subunita codificate 
dallo stesso mRNA, una di 27KDa e l'altra di 16KDa, 
legate da ponti disolfuro. La Bg e sintetizzata 
come unico polipeptide precursore, consistente in 
un putativo segnale peptidico e nelle due subunita. 
Tale polipeptide viene processato per dare la 
proteina dimerica matura. II gene della Bg e 
presente nel genoma in circa quattro copie 
(Watanabe e Hirano, 1994) . 

Questa proteina e prevalentemente local izzata 
nei tessuti embrionali del seme ed il suo pattern 
di espressione e strano per una proteina di 
riserva. Infatti una parte di Bg si accumula negli 
spazi intercellulari del parenchima dei cotiledoni 
(Nishizawa et al . , 1994), mentre a livello 
intracellulare si accumula in corpi proteici sulla 
lamella mediana della parete cellulare e nella 
membrana plasmatica (Watanabe e Hirano, 1994) . 

Questa local izzazione suggerisce che la Bg non 
sia una semplice proteina di riserva, ma abbia 
anche altre funzioni. Dati piu precisi sulla 
localizzazione e sul periodo di espressione della 
Bg in soia non sono disponibili. Non e mai stato 
verificato se il meccanismo di espressione sito- e 
tempo- specif ica e conservato in altre specie 



vegetali trasformate (es. tabacco) . Ci si riferisce 
per questo ai dati generali sulle proteine di 
riserva e a studi sull'analogo della Bg in lupino 
(conglutina y) , con cui essa ha un'elevata omologia 
di sequenza . Questa proteina viene accumulata solo 
nei tessuti embrionali di lupino (cotiledoni ed 
asse embrionale) 4 0 giorni dopo la fioritura. Non e 
stata individuata in altri tessuti come foglie e 
germogli. In semi di tabacco transgenico, il gene 
della conglutina y viene espresso in maniera 
crescente dal 15° al 20° giorno dopo la fioritura 
fino al 40°, poi comincia a decrescere (Ilgoutz et 
al. , 1997) . 

Una delle caratteristiche peculiari della Bg 
e che essa viene secreta in grande quantita dai 
semi di soia quando vengono immersi in acqua a 40- 
60 °C. Non si sa se le proteine secrete sono 
neosintetizzate al momento del trattamento a caldo 
o sono le proteine gia presenti ad essere secrete. 
Dal momento che si e evidenziato anche un aumento 
dello specifico mRNA in seguito al riscaldamento, 
si pensa che la Bg sia ef f ettivamente sintetizzata 
in seguito alio shock termico (Hirano et al . , 
1989) . 



Non si conosce molto sul meccanismo di 
regolazione dell ' espressione del gene della 
proteina Bg, ma sono state identificate sequenze 
nella zona promotore implicate nella regolazione 
genica. Oltre alia sequenza CAAT box e TATA box, 
rispettivamente in posizione -116 e -25 rispetto al 
sito d'inizio della trascrizione, sono stati 
individuati tre elementi regolatori simili a 
seguenze enhancer termo- specif iche present! nella 
regione 5' non trascritta di geni in altri 
organismi. Questi heat shock elements (HSE) sono 
composti da due unita di 5 pb conservate : 5' -NGAAN- 
3' e 5'-NTTCN-3'. Nel promotore termoregolato della 
proteina indotta da shock termico di soia, gli 
elementi enhancer, visti anche in Bg, cooperano 
sinergisticamente con tre sequenze CCAAT box 
presenti a monte aumentando 1 ' espressione del gene; 
anche nel promotore di Bg sono presenti queste 
sequenze putative. 

Non sono state identificate le sequenze 
responsabili della sito- e tempo- specif icita 
dell ' espressione . 

L'interesse per questa proteina nasce dal 
fatto che viene accumulata nel seme di soia in 
quantita elevata (3% delle proteine totali) ed ha 



quindi un promotore seme -specif ico forte, che pud 
garantire un elevato livello di espressione del 
gene da esso regolato. Si sa inoltre che il 
meccanismo di regolazione di questa proteina e 
diverso da quello delle altre proteine di riserva 
del seme di soia, ma non se ne conoscono i 
dettagli. Studi sul promotore e sul suo meccanismo^ 
di attivazione sito- e tempo-specif ico non s^gjiQ^ 
comunque mai stati condotti utilizzando $?.hf- 
reporter in piante transgeniche . \<\ 

Sia la Bg che la CONG in quanto proteine di 
riserva vengono sintetizzate solo nei tessuti del 
seme e sono accumulate in grande quantita nelle 
cellule che compongono quest ' organo, all'interno di 
precisi compartimenti . Per quanto riguarda il 
livello di regolazione post-trascrizionali e 
soprattuto post-traduzionali, esso passa attraverso 
i meccanismi di trasporto intracellulare e di 
compartimentalizzazione delle proteine, meccanismi 
per molti aspetti ancora da chiarire. 

In questi meccanismi sono implicati infatti 
tutti i processi che influenzano la concentrazione, 
la ritenzione e lo smistamento delle proteine nel 
sistema di endomembrane (Okita, 1996) . 
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Esistono comunque dei principi general i del 
targeting proteico validi per tutte le specie 
vegetali . 

1. Le informazioni di indirizzamento risiedono 
nelle proteine stesse, sotto forma di segnali 
discreti. Questi segnali vengono intercettati da 
meccanismi di riconoscimento specifici che possono 
essere recettori o semplici interazioni con lipidi 
di membrana . 

2. Esistono diversi tipi di segnali (sequenze 
topogeniche) ciascuno con funzione specif ica. Fra 
questi vi sono sequenze -segnale, le quali danno 
inizio alia traslocazione della proteina attraverso 
endomembrane specifiche ed interagiscono con 
recettori/traslocatori che facilitano il 
trasf erimento unidirezionale . Si trovano poi 
sequenze di stop e di ritenzione che bloccano il 
trasf erimento nella membrana o all'interno del 
compart imento . Sequenze di selezione indirizzano le 
proteine verso i vari compartimenti cellulari. 

Tutti questi elementi possono essere di tipo 
sequenziale, localizzati nella parte N-terminale , 
centrale o C-terminale della proteina, o 
conf ormazionali , cioe costituiti da aminoacidi non 
sequenziali, ma adiacenti nella conf ormazione 
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nativa della proteina. Vi possono essere inoltre 
piu segnali contemporaneamente e possono essere 
modif icati o attivati (esempio per f osf orilazione) . 

Spesso il segnale viene deleto dopo il 
trasferimento utilizzando siti di taglio specific! 
per proteasi endogene. 

Anche l'accumulo dell'mRNA in una particolare 
zona influenza la localizzazione della proteina. Le 
proteine di riserva dei semi di sola, sia globuline 
che lectine, vengono depositate in vacuoli di 
riserva. Esistono infatti diversi tipi di vacuoli, 
alcuni di questi, oltre ad avere la funzione di 
mantenimento della pressione di turgore e di 
regolare il rilascio di ioni, zuccheri ed 
aminoacidi, sono anche il compartimento di deposito 
di proteine di riserva e di difesa. La sequenza 
segnale specifics per 1 ' indirizzamento al vacuole 
non e ancora stata identif icata, se non per alcune 
specie vegetali (Kermode, 1996). E' probabile che 
una o piu region! superficial! della proteina 
correttamente conformata siano riconosciute dal 
meccanismo di selezione. Caratteristica unica delle 
cellule vegetali e quella di accumulare le proteine 
di riserva nei corpi proteici. Negli animali invece 
simili corpi di inclusione vengono format! solo 



guando si verifica un eccesso di sintesi proteica. 
Questi corpi proteici sono quindi agglomerati 
disordinati di proteine conf ormazionalmente non 
corrette o parzialmente processate. Nelle piante il 
processo di formazione e 1 ' organizzazione dei corpi 
proteici non e chiaro, ma si sa che e costituito da 
una serie di eventi ordinati (Okita, 1996) . Le 
globuline sono proteine con pi acido e quindi 
vengono traslocate nel RE e nel complesso di Golgi 
come proteine solubili. Appena giunte nel vacuolo, 
a causa del pH basso o forse dei processamenti e 
dell ' assemblaggio, queste proteine precipitano 
formando addensamenti parti col at i che daranno 
origine poi ai corpi proteici (Kermode, 1996) . 

Nelle leguminose proteine di riserva diverse 
vengono accumulate negli stessi corpi proteici 
senza separazioni spaziali. In altre specie 
vegetal i i corpi proteici si formano nel RE e 
vengono poi inglobati nel vacuolo per 
autof agocitosi (Kermode, 1996) . 

Questo schema generale e valido anche per la 
P-conglicinina, anche se per questa proteina non 
sono state identificate le sequenze specifiche di 
targeting al vacuolo. E' stato invece osservato il 
legame della p-conglicinina con una proteina 
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omologa alia BIP. Questa proteina funziona da 
chaperonina e, come per altre proteine in altre 
specie vegetali, P u6 avere il ruolo di ritenere la 
P-conglicinina nel RE fino a che non ha raggiunto 
la corretta conf ormazione (Galili et al . , 1993; 
Shewry et al . , 1995; Kermode, 1996; Fontes et al . , 
1996). Per quanto riguarda la globulina basica 7S 
le informazioni sono poche. Si sa che e localizzata 
in corpi proteici sulla lamella mediana della 
parete cellulare e nella membrana plasmatics e non 
nei vacuoli (Watanabe, 1994). Per questo si 
ipotizza che il suo meccanismo di 

compartimentalizzazione sia diverso da quelle della 
P-conglicinina. Si sa comunque che anche le 
proteine localizzate sulla parete seguono la stessa 
via di trasporto delle proteine vacuolar! , 
sono tradotte sul RE, poi vengono trasportate 
Golgi ed infine secrete all'estemo o inserit 
nella membrana tramite traffico vescicolare. 

L'espressione delle proteine di riserva 
ospiti eterologhi mostra comunque che il meccanis 
di compartimentalizzazione e universale. In piante 
transgeniche le proteine di riserva del seme 
vacuolar! vengono correttamente indirizzate. 

Talvolta pero il trasporto pud non essere 
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efficiente soprattutto in organi vegetativi 
rispetto ai semi . In tabacco le proteine di riserva 
dei legumi vengono correttamente indirizzate ai 
vacuoli sia nei semi che nelle foglie, ma nelle 
foglie il livello di accumulo e minore. Questo 
perche esiste una differenza nell' ef f icienza di 
trasporto oppure un diverso grado di processamento 
(proteasi diverse o maggiore instability) . Si 
comprende quindi come la produzione seme - specif ica 
di una proteina eterologa umana in pianta sia un 
meccanismo complesso, per cui un passaggio 
importante e la verifica preliminare sul 
f unzionamento e la efficienza del sistema di 
espressione costruito in un organismo ospite 
modello . 

Una delle piante maggiormente utilizzate a 
questo scopo come si e visto e il tabacco. II suo 
utilizzo pref erenziale nella sperimentazione deriva 
dal fatto che essa e una delle piante piu 
conosciute sia da un punto di vista genetico che da 
un punto di vista biologico e fisiologico. Questo 
fatto unitamente alia facilita di operare la 
trasf ormazione genetica e la velocita del ciclo 
vegetativo l'ha resa quindi un modello importante 
per gli esperimenti biotecnologici , un modello sul 



quale si e ormai acquisita esperienza sia per 
quanto riguarda i- sistemi specifici di 
trasformazione che per quanto riguarda . le 
condizioni di micropropagazione . II tabacco 
presenta inoltre l'ulteriore vantaggio della quasi 
completa estendibilita dei risultati ottenuti a 
numerose altre specie vegetali, conseguente alia 
elevata conservazione dei meccanismi di regolazione 
genica, che si sono dimostrati molto conservati 
appunto in altre specie vegetali, ed in particolare 
nelle leguminose. Quindi si presta in particolare 
ad essere un modello particolarmente adatto per lo 
studio dei promotori da queste prelevati, ed in 
particolare della loro capacita di far esprimere in 
modo control lato un gene di interesse in una pianta 
trasformata . 

I geni di interesse sono generalmente geni 
codificanti proteine utilizzabili in campo 
farmaceutico o alimentare. In questo senso un 
gene eterologo di interesse per questo tipo di 
applicazione e quello della lattoferrina umana, che 
e una proteina appartenente alia famiglia delle 
trans f errine, e come tale e in grado di legare 
stabilmente ed in modo reversibile due ioni ferro. 

La lattoferrina infatti e una proteina che in 




relazione alle sue funzioni biologiche, si rivela 
interessante sia dal punto di vista nutrizionale 
che f armacologico. Essa e presente nel latte umano 
e svolge un ruolo fondamentale nell ' alimentazione 
dei neonati, infatti a questa proteina vengono 
riconosciute molteplici funzioni biologiche, fra 
cui un'attivita battericida e batteriostatica 
contro una vasta gamma di microrganismi patogeni e 
la capacita di aumentare 1 ' assorbimento del ferro a 
livello intestinale (Lonnerdal e Iyer, 1995; 
Hambraeus e Lonnerdal, 1993) . Inoltre essa promuove 
la crescita cellulare, regola la mielopoiesi ed e 
in grado di modulare la risposta inf iammatoria 
(Lonnerdal e Iyer, 1995; Oguchi et al . 1995; Penco 
et al. 1995) . 

In questo senso, si e in prima battuta tentato 
di ricercare una proteina capace di legare il ferro 
e che possegga queste proprieta nel latte di altri 
mammif eri . 

Si e visto che il latte di tutti i mammiferi 
contiene due tipi di proteine capaci di legare il 
ferro, presenti in rapporti diversi : la 
transf errina, identica alia sierotransf errina, e la 
lattoferrina . Il latte umano e parti col armente 
ricco di lattoferrina, infatti la sua 
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concentrazione nel colostro e di 5-10 mg/ml, anche 
se decresce durante 1 ' allattamento a circa 1 mg/ml 
nel latte maturo (Hambraeus e Lonnerdal, 1993) . Nel 
latte di altre specie animali, come la capra, il 
cavallo, il maiale ed il topo, la quantita di 
lattof errina e pero molto piu bassa. Nel latte 
bovino, ad esempio, la concentrazione e di circa 
0/1 mg/ml. In alcune specie come il coniglio, il 
ratto ed il cane, la lattoferrina e assente e la 
proteina prevalente che lega il ferro e invece la 
transf errina . 

Inoltre, la lattoferrina prodotta da specie di 
mammiferi diversi dalla specie umana, assume in 
ciascuna di esse caratteristiche strutturali e/f 
quindi proprieta diverse. 

La lattoferrina umana (LFU) e un^; 
glicoproteina monomerica di 78 KDa, con strut tura 
bilobata. Fra il dominio N-terminale e quello C- 
terminale vi e un elevato grado di omologia, sia a 
livello di sequenza aminoacidica (37%) che di 
struttura tridimensionale . La struttura 

tridimensionale e stata descritta nel dettaglio 
attraverso cristallograf ia a raggi X (Lonnerdal e 
Iyer, 1995) . II gene per la LFU e stato clonato e 
sequenziato. Si conoscono anche i meccanismi di 



regolazione genica a livello trascrizionale e 
traduzionale ed il ruolo degli estrogen! e del 
ferro in questi meccanismi (Liu et al, 1991) . La 
proteina matura e costituita da una catena 
polipeptidica di 692 aa ed ha un pi =8/8 - 9. Essa 
contiene 16 ponti disolfuro e mostra una certa 
resistenza alia proteolisi (Lommerdal , 1995), 
presenta tre catene glicaniche poli- 
acetilactosaminiche legate con legami N-glicosidici 
ai residui aminoacidici Asn233, Asn476 e Asn545 ed 
il peso molecolare della proteina glicosilata e di 
82 KDa . 

Una delle differenze piu importanti fra le LF 
presenti nelle varie specie animali e proprio la 
composizione delle catene glicosidiche . Infatti la 
LF bovina, diversamente dalla LFU, contiene residui 
galattosidici a-1,3 e glicani di tipo 
oligoraannosidico; il ruolo delle catene 
glicosidiche non e ancora stato definito, tuttavia 
e possibile che i glicani proteggano la LFU contro 
attacchi di enzimi proteolitici . 

Ciascuno dei due domini della LFU e in grado 
di legare strettamente, ma reversibilmente uno ione 
ferrico e contemporaneamente una molecola di ione 
carbonato o bicarbonato (Hambraeus e Lonnerdal, 
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1993) . I siti di legame per il ferro nella 
lattof errina ■ del latte umano non vengono saturati 
completamente, ma solo per il 6-8% della loro 
capacita (Stowell et al . , 1991). 

in questi anni, sono stati condotti una serie 
di studi mirati a comprendere i meccanismi di 
azione e la relazione fra struttura molecolare e 
funzione di questa proteina. La strategia adottata 
e stata quella di studiare molecole di LF alterate 
nella struttura attraverso mutagenesi sito- 
specifica. Si sono percio cercati sistemi di 
espressione di LFU ricombinante che producessero, 
in modo semplice e poco costoso, una proteina 
identica il piu possibile a quella purificata dal 
latte umano. 

Tutti gli ospiti eterologhi fin qui utilizzati 
per la LFU ricombinante sono comunque eucarioti, 
dato che essendo una glicoproteina complessa, essa 
richiede un apparato di processamento evoluto. 

Nel 1991 Stowell e collaborator! hanno clonato 
il gene della LFU in cellule renali di criceto 
neonato in coltura. Per massimizzare 1 ' espressione 
e state utilizzato un promotore Zn2+-inducibile ed 
il segnale di secrezione di una proteina endogena 
di criceto. La concentrazione di LFU ricombinante 




secreta nel mezzo di coltura e di circa 20 mg/1, 
sufficiente per la cristallizzazione e quindi per 
studi strutturali. La caratterizzazione di guesta 
proteina ha rivelato che ha la stessa massa 
molecolare della LFU nativa e che conserva intatto 
il sito di legame al ferro. Le uniche differenze 
che essa presenta rispetto alia LFU del latte umano 
sono nelle catene glicosidiche e nella sequenza N- 
terminale, ma queste non influiscono sul folding. 

Un simile sistema di espressione e molto 
costoso e non e adatto per la produzione di 
quantita di proteina richieste a livello 
industriale . 

Successivamente la LFU e stata espressa nel 
latte di topi transgenici. In questo caso non si 
sono trasformate cellule in coltura, ma l'intero 
animale, utilizzando la sequenza regolatrice del 
gene bovino della caseina a-Sl. Si e dimostrato che 
1'mRNA di LFU viene espresso solo nelle ghiandole 
mammarie in femmine durante 1 ' allattamento. La 
proteina nel latte raggiunge la concent razi one di 
0,1-36 ug/1- Recentemente questa LFU ricombinante e 
stata caratterizzata (Nuijens, 1997) , e si £ visto 
che presenta la stessa massa molecolare, la 
sequenza N-terminale e 1 ' immunoreattivita della LFU 



nativa. Essa mantiene anche la capacita di 
rilasciare il ferro a pH acido ed il legame ai 
lipopolisaccardi batterici. Anche in questo caso la 
glicosilazione presenta delle differenze dalla LFU 
nativa, come anche l'azione battericida ed ariti- 
inf iammatoria in vivo. 

Un sistema di produzione di LFU ricombinante 
di estrema rilevanza e sicuramente stato quello 
realizzato in Aspergillus awamori (Ward et al, 
1995) . Con questo metodo, che e coper to da 
brevetto, si ottengono quant ita commercial i di LFU 
ricombinante (2 g/1) - Per massimizzare 
l'espressione, la LFU viene prodotta come proteina 
di fusione con parte del gene strutturale, la 
sequenza di regolazione ed il segnale di secrezione 
nel mezzo di coltura della glucoamilasi . Il 
polipeptide di fusione viene processato per dare la^ 
LFU matura da una peptidasi endogena. /V a ^ 
glucoamilasi e una proteina di Aspergillus esp||p%a 

in grandi quant ita. \% 

Un ospite eucariotico alternativo e querio 
usato da Mitra e collaborator! nel 1994. Essi hanno ~ 
trasformato cellule di tabacco in sospensione. Nei 
calli transgenici viene prodotta, in piccole 
quant ita, una proteina molto piu corta della LFU 




nativa, che quindi si e dimostrata instabile. La 
LFU ricombinante ha attivita contro batteri 
f itopatogeni , fra cui Xantomonas campestri, 
Pseudomonas syringae ed altri. Nel lavoro citato 
non e riportato 1 ' ottenimento di piante intere e 
fertili . 

Recentemente la LFU e stata prodotta anche in 
cellule di insetto in coltura, utilizzando come 
sistema di espressione il Baculovirus (Salmon et 
al . , 1997). Questo e un sistema di espressione 
molto potente e da una proteina ricombinante 
identica alia nativa, tranne che per il livello di 
glicosilazione . Essa mantiene comunque il legame 
con i ricettori specif ici. 

Tutti i sistemi di espressione sopra riportati 
permettono di ottenere una quantita di proteina 
sufficiente per studi funzionali ed in alcuni casi 
anche per utilizzi commerciali (Aspergillus). In 
quest 'ultimo caso perd l'utilizzo sicuro della 
proteina purificata, per esempio in preparati 
sostitutivi del latte in neonati, richiede una 
purif icazione spinta onde garantire l'assenza'di 
sostanze immunogeniche o allergeniche . Non sono 
comunque mai state utilizzate piante transgeniche a 
questo scopo, ne sono mai stati realizzati prodotti 




utilizzabili direttamente per 1 ' aliment azione 
umana, per esempio attraverso 1 ' espressione di LFU 
ricombinante in piante alimentari. 

Sommario dell ' invenzione 

La presente invenzione si riferisce ad un 
sistema generale di accumulo tessuto specifico ed 
in particolare seme specifico di proteine 
eterologhe, studiato e realizzato alio scopo di 
massimizzarne la produzione prevenendo la loro 
degradazione mediante utilizzo delle sequenze 
leader e i promotori dei geni Bg e (3 conglicinina . 
A questo fine la parte strutturale del gene scelto 
potra codificare per proteine ad attivita 
enzimatica / utilizzate in terapia umana o in 
processi industrial^ o proteine con attivita 
f armacologica generale (lattof errina) o specifica 
(anticorpi o antigeni) o proteine anticorpali per 
la f itodepurazione o per 1' eliminazione di 
micotossine presenti negli alimenti. 
La presente invenzione si riferisce in particolare 
ad un sistema che consentendo la espressione 
tessuto specifica in pianta del gene della 
lattof errina umana, fornisce una importante 
soluzione al problema della produzione di questa 
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proteina. Tale sistema infatti, determina la 
produzione di piante in grado di esprimere quantita 
relativamente elevate di questa proteina che, nella 
forma di realizzazione preferita, che prevede la 
espressione di un gene sintetico progettato dagli 
inventori in modo da massimizzarne la espressione 
in pianta, raggiunge livelli industrialmente 
rilevariti. Tali piante transgeniche inoltre 
consentono di evitare i costosi procedimenti di 
purif icazione del prodotto, potendo essere 
utilizzati come nutraceuticals , ed essere quindi 
assunte direttamente come alimenti. In questo senso 
ne e possibile anche l'uso per la produzione di 
farine proteiche o estratti proteici, ricavati da 
tessuti ed in particolare da seme delle piante 
trasgeniche su menzionate, per la produzione di 
cibi funzionali o preparati special i per 
l'infanzia. Tali piante possono essere comunque 
utilizzate anche per la purif icazione di 
lattoferrina umana, tramite metodi convenzionali 
basati su tecniche cromatograf iche . 

Questo sistema di espressione prevede inoltre 
l'utilizzo di nuovi vettori ricombinanti , costruiti 
verificando l'effetto di diverse sequenze segnale e 
diversi siti di processamento della proteina 
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matura, che consentono la produzione di una 
qualsiasi proteina di interesse ed in particolare 
della lattoferrina o di frammenti da essa derivati, 
con un " accumulo tessuto specif ico della proteina, 
in piante appartenenti a diverse famiglie tra cui 
le leguminose, i cereali, le solanacee, le piante 
da frutto e le orticole in genere. Essi in 
particolare sono strutturati in modo da presentare 
i seguenti componenti funzionalmente legati: (a) un 
promotore; (b) una sequenza segnale (o "leader"); 
(c) una sequenza nucleotidica ottimizzata per 
1 ' espressione in pianta e corrispondente alia 
sequenza aminoacidica della lattoferrina umana 
intera o a frammenti di quest a; (d) un segnale di 
poliadenilazione . 

In particolare e considerato il caso in cui si 
tratta di plasmidi, ed in cui gli elementi di 
regolazione e le sequenze. di segnale utilizzati 
sono quelli appartenenti a due geni che codificano 
per proteine di riserva molto abbondanti nei semi' 
di soia e cioe una p-conglicinina ed una globulina 
basica IS, isolate e donate dalla varieta di soia 
Richland. Essi possono essere utilizzati per la 
trasf ormazione di cellule vegetali sia con il 
metodo dell' Agrobacterium, sia con metodi fisici 
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diretti (Gelvin e Schilperoort , 1995; DuPont 
Biolistic Manual, DuPOnt) . Le cellule vegetali 
trasformate sono quindi selezionate con l'apposito 
agente selettivo e indotte a formare piante intere 
fertili in grado di formare semi e quest i di 
esprimere il gene lattoferrina e di accumulare 
questa come proteina di riserva. 

Questo risultato e" stato ottenuto disegnando e 
sintetizzando un gene artificiale che codifica per 
la stessa sequenza amminoacidica del gene umano 
naturale ma presenta delle mutazioni nella sequenza 
tali che i codoni piu f requentemente utilizzati 
dalla cellula umana, sono sostituiti con quelli piu 
f requentemente usati dalla cellula vegetale. Questo 
risultato si e concretizzato nel cambiamento del 
31% dei codoni del gene originale (vedi tabella 1 
infra) . La notevole produzione di lattoferrina 
umana riscontrata nelle varie piante trasformate 
con il gene sintetico, con produzioni che vanno 
dall'1% al 1,8% del totale delle proteine di 
riserva del seme, ma non nelle piante con il gene 
naturale, ne ha dimostrato la funzionalita in 
pianta . 

In relazione a tutto quanto esposto, oggetto 
della presente invenzione e* un polinucleotide 




codificante per la lattoferrina umana, 
caratterizzato dal fatto di avere una sequenza 
totalmente o parzialmente corrispondente alia 
sequenza riportata come SEQ ID N0:1, e dal fatto 
che detta sequenza e ottimizzata per la espressione 
in pianta, ed in particolare il caso in cui detto 
polinucleotide presenta fusa alia parte 5' 
terminale una sequenza seel t a dal gruppo 
comprendente le sequenze rappresentate come SEQ ID 
NO: 13 e NO: 14. 

Oggetto della presente invenzione e anche la 
proteina lattoferrina umana, ottenuta dalla 
espressione delle sequenze su citate. 

Ulteriore oggetto della presente invenzione e 
un vettore a DNA ricombinante, in particolare un 
plasmide, comprendente almeno una sequenza di un 
gene di interesse, in particolare il gene 
codificante per la lattoferrina umana completa, 
specif icamente la sequenza totalmente o 
parzialmente corrispondente alia SEQ ID N0:1, 
operativamente collegata ad elementi di regolazione 
che consentono la espressione tessuto specifica di 
detto gene. Caso particolare e quello in cui tali 
elementi di regolazione sono costituiti da una 




"cassetta di espressione per piante" che consente 
la espressione tessuto specif ica di detto gene. 

Ulteriori casi di interesse sono quell i in cui 
la "cassetta di espressione" per piante e 
costituita dagli element! di regolazione della 
proteina Globulina basica IS, ed in particolare 
quando tra detti elementi di regolazione vi e la 
sequenza del promotore riportata come SEQ ID NO: 21, 
oppure dagli elementi di regolazione della proteina 
p-conglicinina, ed in particolare quando tra detti 
elementi di regolazione vi e la sequenza del 
promotore riportata come SEQ ID NO: 22, il caso in 
cui la sequenza del gene codificante totalmente o 
parzialmente per la lattoferrina umana e 
operativamente collegata o anche fusa, ad una 
sequenza segnale (o "leader") , ed il caso in cui 
tale sequenza segnale e scelta dal gruppo 
comprendente le sequenze riportate come SEQ ID NO: 
13 e NO: 14. 

Particolare importanza riveste il caso in cui 
tale plasmide e scelto dal gruppo comprendente i 
vettori pBI, pGEM o pUC. 

Costituisce oggetto della presente invenzione 
anche il procedimento di trasf ormazione di cellule 
vegetali in cui la trasf ormazione e effettuata con 
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uno dei vettori su menzionati, le cellule vegetali 
transgeniche ottenibili tramite la trasformazione 
di cellule vegetali di tipo selvatico con almeno 
uno degli stessi vettori, e le cellule che comunque 
contengono un gene di interesse, o sue porzioni, ed 
in particolare il • gene codif icante per la 
lattoferrina umana operativamente collegato ad una 
"cassetta . di espressione" , che consente la 
espressione tessuto specifica del gene stesso, in 
particolare quella del gene codificante per la 
Globulina basica 7S e del gene codificante per la 
P-conglicinina . 

Costituiscono inoltre oggetto della presente 
invenzione "aggregati cellulari" ed in particolare 
calli, caratterizzati dal fatto di essere 
ottenibili dalle suddette cellule. 

Oggetto della presente invenzione sono an 
le piante transgeniche ottenibili dalle sud 
cellule tramite tecniche convenzionali, o 
comunque contengono un gene di interesse e 
particolare il gene codificante per la lattof errih 
umana, specif icamente quello la cui sequenza 
corrisponde alia SEQ ID N0:1, operativamente 
collegato ad una "cassetta di espressione" che 




consente la espressione tessuto specifica del gene 
stesso. 

Particolare rilevanza riveste il caso in cui 
tali piante transgeniche sono scelte dal gruppo 
comprendente solanacee, cereali, leguminose, 
orticole e piante da frutto in genere, in 
particolare la soia, il tabacco e il riso, laddove 
il gene codificante per la lattoferrina e espresso 
specif icamente nei tessuti di riserva o nel frutto. 
Ulteriore oggetto della presente invenzione e l'uso 
di tali piante transgeniche come nutriceuticals. 

Costituiscono oggetto della presente 
invenzione i procedimenti di produzione di cibi 
funzionali contenenti proteine prodotte dalle 
suddette piante transgeniche, di latti vegetali, a 
part ire da proteine in forma naturale e/o in 
concentrato derivate dalle su menzionate piante , e 
comunque qualsiasi procedimento di produzione di 
lattoferrina umana, caratterizzato dal fatto di 
utilizzare le suddette piante. 

Oggetto della presente invenzione e infine 
anche la lattoferrina umana ottenuta dalle suddette 
piante transgeniche. 

L' invenzione verra meglio descritta con 
l'aiuto delle figure annesse. 



Descrizione de l"!** figure 

La figura 1 mostra la strategia seguita per 
l'assemblaggio del gene sintetico per la 
lattoferrina umana. 

La figura 2 mostra la mappa dei plasmidi pGEM- 
PGLOB(A) e pGEM-PCONG (B) ottenuti dal clonaggio 
dei promotori di soia nel plasmide pGEM (Promega) , 
in cui sono evidenziati i siti di restrizione 
utilizzati per derivare i plasmidi. 

La figura 3 mostra l'analisi elettrof oretica 
condotta su gel di agarosio della digest ione dei 
plasmidi pGEM-PGLOB con Sal I (linee 1, 2, 3 e 4) e 
pGEM-PCONG CON Sph I (linee 6, 7, 8 e 9) , posta in 
essere per verificare 1' orientamento dell'inserto 
in direzione oraria. Tutti i campioni PGLOB sono 
risultati positivi dando i frammenti delle 
dimensioni attese. PGLOB 1 e il campione 1 scelto 
per il lavoro molecolare successivo. I campioni 
PCONG invece non hanno dato il pattern previsto 
suggerendo la possibility di trovarsi in presenza 
di errori dovuti alia tecnica di clonaggio usata 
(ipotesi scartata successivamente, vedi figura 6) 
oppure dovuta all ' isolamento di una variante della 
regione di regolazione che nella varieta Richland e 
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diversa da quella della sequenza pubblicata 
(varieta Dare) . II campione 5 e il marcatore lambda 
Hindi I I . 

La figura 4 mostra l'analisi elettrof oretica 
su gel di agarosio della restrizione di due cloni 
del plasmide pGEM-PCONG con gli enzimi Nde I (linee 
1 e 2) , Rsa I (linee 3 e 4) , e SnaB I (linee 9 e 
10) condotta alio scopo di verificare 
1' orientamento e l'identita dei costrutti. I tagli 
con Nde I , Apa I e SnaB I danno i pattern attesi a 
differenza del taglio operato con Rsa I; questi 
risultati sono giustificati dalle differenze di 
sequenza riscontrate e riportate in figura 6. In 
posizione 5 e 6 sono present! i marcatori di peso 
molecolare A.-DNA Hind III e Marker IV (Boehringer) 
rispettivamente . 

La figura 5 mostra l'analisi elettrof oretica 
della restrizione di diversi cloni del plasmide 
pGEM-PCONG con gli enzimi Rsa I (linee 1-6) e Hinf 
I (linee 9-14) per la verifica dell ' identita dei 
costrutti. In entrambi i casi i pattern ottenuti 
non rispecchiano quelli attesi, ma sono conservati 
tra i diversi cloni suggerendo che siano pertanto 
dovuti a differenze nella sequenza originale 
rispetto alia mappa di restrizione depositata e non 
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ad errori nella fase di amplif icazione con la Taq 
polimerasi o di clonaggio. I marcatori usati sono 
X-DNA Hind III e Marker IV. 

La figura 6 mostra il confronto tra la 
sequenza pubblicata della regione promotore del 
gene CONG con guella clonata nel plasmide pGEM- 
PCONG. 

La figura 7 mostra una rappresentazione 
schematica dei due plasmidi risultanti dal 
clonaggio del gene naturale LFU nei due vettori 
pGEM-T e pBI121, per dare luogo a plasmidi 
utilizzati successivamente come controllo della 
trasf ormazione . 

La figura 8 mostra la mappa dei due plasmidi 
risultanti dal clonaggio del gene LFU sintetico nei 
vettori pGEM-PGLOB e pGEM-PCONG e cioe 
rispettivamente i plasmidi pGEM - PGLOB - LFU (A) 
pGEM-PCONG-LFU (B) . 

La figura 9 mostra la mappa dei plasmidi ^>fii% 
PGLOB -LFU (A) e pBI -PCONG-LFU (B) in cui sc*f9> 
evidenziati i siti di restrizione utilizzati. In 
particolare il riquadro (A) mostra la costruzione 
del plasmide contenente il gene sintetico 
rappresentato nella lista di sequenze come SEQ ID 
N0:1 e clonato nel plasmide pBHOl fuso al 




promotore PGLOB ed in "fase di lettura aperta" con 
il segnale della globulina basica IS. 
II riquadro (B) invece mostra la costruzione del 
plasmide contenente il gene sintetico riportato 
nella lista di sequenze come SEQ ID NO: 1 e clonato 
nel plasmide pBHOl fuso al promotore PCONG e in 
"fase di lettura aperta" con il "leader" della {3- 
coglicihina . 

La figura 10 mostra l'analisi elettrof oretica 
della restrizione di diversi cloni del plasmide 
pBI-PCONG-LFU con gli enzimi Xba I, BamH I, Sac I; 
i campioni 4 e 5 risultano positivi . In posizione 6 
d presente il marcatore di peso molecolare Ladder 
1Kb. 

La figura 11 mostra l'analisi elettrof oretica 
della restrizione di due cloni del plsmide pBI- 
PCONG-LPU con gli enzimi Sal I (linee 1 e 2) e con 
Xba I e Sac I (linee 4 e 5) ; entrambi i campioni 
sono positivi. I campioni 3 e 6 rappresentano i 
controlli positivi e ciod pGEM- PCONG- LFU digerito 
rispettivamente con Sal I, con Xba I e Sac I. 

La figura 12 "mostra l'analisi elettrof oretica 
su gel di agarosio dei prodotti di PCR da DNA 
genomico estratto da diverse piante trasformate con 
pBI- PGLOB -LFU, condotta utilizzando i primers PLT4 8 
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e PLT49 per la sequenza promotore PGLOB. I campioni 
positivi 2, 3, 4 e 5 mostrano la banda del DNA 
amplif icato a 1500 bp, mentre i campioni 6, 7 e 8 
rappresentano rispettivamente il controllo negativo 
di PCR ed il controllo posit ivo (pGEM- PGLOB) . In 
posizione 1 e 9 si trovano i marcatori di peso 
molecolare Ladder 1Kb. 

La figura 13 mostra nel riquadro (A) il gel di 
agarosio con il DNA genomico di tabacco trasformato 
con pBI-PCONG-LFU (linee 1-5) o con pBI-PGLOB-LFU 
(linee 6-9) tagliato con l'enzima BamH I. Me il 
marcatore di peso molecolare Ladder 1 Kb. Il 
campione 10 mostra il controllo positivo pGEM-LFU, 
non visibile nella foto per motivi quantitativi . 
Nel riquadro (B) e mostrato " il pattern di 
ibridazione della sonda LFU sul DNA genomico delle 
stesse piante di tabacco; i campioni 1, 2 e 3, 
rispettivamente appartenenti alle piante PCONG 1, 
PCONG 3, e PCONG 4 sono positivi cosi come i 
campioni 5, 7 e 8, rispettivamente appartenenti 
alle piante PGLOB 10, PGLOB 3 e PGLOB 4. E' 
evidente che pGEM-LFU, il controllo positivo (linea 
10) , e stato solo parzialmente digerito in quanto 
sono present i anche le forme superawolte del 
plasmide . 



La figura 14, mostra l'analisi elettrof oretica 
SDS-PAGE di proteine parzialmente purificate da 
semi delle piante transgeniche verificate con il 
Southern della figura precedente (A) e l'analisi 
Western delle stesse, dopo trasf erimento su 
membrana, utilizzando anticorpi policlonali 
specifici per la lattoferrina umana (B) . In 
particolare nel riquadro (A) e mostrata l'analisi 
elettrof oretica SDS-PAGE di proteine totali 
cellulari da semi maturi (30 DAP) di tabacco 
transgenico. In posizione 2, 3, 4 e posizione 5, 6, 
7 si trovano gli stessi campioni risultati positivi 
al Southern blot, estratti con un tampone 
rispettivaemnte a pH 2,7 e pH 7,6. I campioni 8 e 
10 rappresentano il controllo positivo 
(lattoferrina umana estratta da latte, Sigma) e- 
controllo negativo (pianta non trasformata della 
stessa varieta) , mentre in posizione 9 si trova il 
marcatore di peso molecolare Rainbow (Amersham) . 
Nel riquadro (B) e mostrata 1 ' autoradiograf ia 
dell' ibridazione dell' ant icorpo anti -lattoferrina 
con le stesse proteine trasferite su membrana di 
nitrocellulosa-DEAE; il campione corrispondente 
alia pianta PGLOB 10, in posizione 2 e 5, non da un 
segnale positivo, anche se dall'analisi Southern 



49 



risulta essere trasformato. Tutti gli altri 
campioni risultano positivi. 

La figura 15 mostra l'analisi elettrof oretica 
di proteine grezze estratte da foglie e semi di 
tabacco transgenico trasformato con i plasmidi di 
cui alia figura 9. In particolare nel riquadro (A) 
e riportata la colorazione delle proteine operata 
con Blue di Comassie. Nel riquadro (B) e riportato 
il Western Blotting eseguito con anticorpi 
specif ici per LFU sulle proteine del gel mostrato 
nel riquadro (A) dopo trasf erimento su membrana. In 
particolare nella linea 1 e riportata la pianta 
PGLOB 1, con proteine estratte da foglia, nella 
linea 2 e riportata sempre la pianta PGLOB 1, con 
proteine estratte da seme, nella linea 3 e 
riportata la pianta PGLOB 3, proteine da foglia, 
nella linea 4 e riportata la pianta PGLOB 3, 
proteine da seme, nella linea 5 e riportata la 
pianta PCONG 105, proteine da foglia, nella linea 
e riportata la pianta PCONG 105, proteine da seme 



nella linea 7 e" riportata la pianta PCONG 105 
proteine da seme, trattate con N-deglicosilasi F 
(vedi testo) , nella linea 8 e" riportato il 
marcatore di peso molecolare, nella linea 9 e 
riportata la LFU presente in commercio trattata con 
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N-deglicosilasi F, nella linea 10 e riportata la 
LFU presente in commercio. 

La figura 16 mostra l'analisi Western della 
proteina LFU estratta da latte umano e della 
proteina ricombinante isolata da seme di tabacco, 
prima e dopo trattamento con l'enzima N- 
deglicosilasi F. L'analisi e eseguita con anticorpi 
specif ici per la lattoferrina umana. Nella linea 1 
e" riportata la proteina LFU estratta e purificata, 
mediante HPLC, da seme della pianta PCONG 105; 
nella linea 2 d riportata la proteina come in 1, 
dopo trattamento con N-deglicosilasi F per 18 ore; 
nella linea 3 e riportata la proteina LFU 
commerciale dopo trattamento con N-deglicosilasi F 
per 18 ore; nella linea 4 e riportata la LFU 
presente in commercio, si pud notare la diminuzione 
di peso molecolare dei due campioni {2 e 3) 
trattati con l'enzima. 



Descrizione dettaqliata dell ' invenzione 

La strategia seguita per la generazione di 
piante transgeniche in grado di produrre 
lattoferrina umana, e stata sviluppata in due 
direzioni : da una parte, sono state svolte analisi 
comparative sui sistemi di espressione di vegetali. 



in particolare modo di tabacco e soia, sulla cui 
base operare la progettazione di una sequenza 
codificante per la lattoferrina umana, ottimizzata 
per massimizzarne la espressione in vegetali. In 
tal senso nella progettazione della sequenza si e 
tenuto conto della necessita che alia proteina 
tradotta potessero essere apportate le necessarie 
modifiche post-traduzionali per la produzione nella 
forma nativa, e che, sia per conf ormazione che in 
seguito alia localizzazione sub-cellulare, la 
proteina fosse suf f icientemente stabile da poter 
essere accumulata in quantita significative nelle 
piante trasformate. Questo si e dimostrato di 
f ondamentale importanza dopo aver verificato, a 
seguito di diversi tentativi eseguiti negli anni 
scorsi, 1 ' impossibility di produrre la proteina 
Lattoferrina umana in pianta utilizzando sia 
sistemi di espressione costitutiva (esempio con il 
promotore 35S) sia con promotori inducibili a 
seguito di taglio delle foglie. Inoltre, oltre alle 
difficolta legate al tipo di promotore utilizzato, 
si e verificato che il livello di produzione della 
proteina e la sua stabilita in pianta erano scarse 
e dipendenti da un uso pref erenziale distorto dei 
codoni tra il gene umano e le piante. 




E' stato quindi sviluppato un si sterna di 
vettori plasmidici, che contenevano un gene 
lattoferrina sintetizzato ex novo posto sotto 
controllo di promotori tessuto e stadio specif ici, 
in grado di consentire una espressione elevata del 
gene e accumulare in modo efficiente e stabile la 
proteina in organi di riserva del seme. Inoltre la 
scelta delle sequenze leader e la progettazione del 
punto di fusione tra queste e la parte strutturale 
della proteina matura ha consentito di ottenere una 
proteina lattoferrina che, in termini quantitativi 
ma non e da escludere anche qualitativi, presenta 
lo stesso livello di glicosilazione della proteina 
nativa e la stessa sequenza aminoterminale , 
importante per alcune caratteristiche funzionali 
della stessa. 

Per quanto riguarda la progettazione del gene 
sintetico si sono modificate tutte le triplette 
necessarie e possibili tenendo conto dell'uso 
pref erenziale di queste nelle due piante di 
riferimento tabacco e soia. Sono stati in 
particolare utilizzati i dati esposti nella tabella 
1. 
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TABELLA 1 




Codoni 


Uomo 


Soia 


Tabacco 


LFU WT 


i ■ i-" 


ARC 


ct;a 


5.6 


4.5 


4.8 


3 








11.2 


7.5 


3.8. 


5 


5 






10.7 


2.2 


2.2 


7 


3 




v— 1j 1 


4.6 


7.4 


7.7 


4 


8 




SfJ 

non 


9.8 


14.8 


12.5 


13 


16 




aw 
AL»v» 


10.8 


11.3 


12.1 


13 


in 




CTA 


6.1 


7.0 


7.4 


0 


2 




GTC 


20.1 


16.2 


12.7 


10 


9 




V.1V» 


42.1 


10.3 


7.1 


28 


8 




CTT 


10.8 


23.7 


21.8 


9 


19 




1 1A 


5.4 


8.4 


10.3 


2 


2 




TTG 


11.1 


20.5 


20.7 


9 


18 


CCD 


1CA 


9.7 


14.7 


15.8 


5 


11 




ICC 


17.8 


9.5 


10.0 


13 


7 




TCG 


4.1 


4.3 


4.3 


2 


2 




TCT 


13.3 


17.3 


20.6 


10 


14 




AGC 


18.7 


16.8 


9.0 


13 


9 




AG I 


9.9 


14.0 


11.9 


8 


8 


THR 


ACA 


14.3 


14.9 


16.4 


8 


8 




ACC 


22.6 


14.0 


11.9 


9 


7 




A<-Aj 


6.6 


3.2 


4.0 


2 


2 




Al-l 


12.6 


17.4 


20.4 


12 


14 


rRO 


CCA 


15.4 


30.6 


26.2 


6 


12 




ccc 


20.6 


10.5 


9.0 


10 


5 






6.8 


4.6 


3.2 


6 


4 




* — ^ X 


16.1 


22.2 


21.7 


13 


14 


ATA 


CCA 


14.4 


20.5 


22.3 


12 


18 




GCC 


29.7 


16.6 


16.2 


25 


16 




GCG 


7.2 


4.7 


4.4 


8 


8 




GCT 


18.9 


23.2 


35.2 


18 


21 


GLY 


GGA 


17.4 


22.7 


31.4 


11 


21 




GGC 


25.3 


11.9 


14.0 


24 


8 




GGG 


17.5 


11.0 


10.0 


12 


o 
o 




GGT 


11.5 


22 . 1 
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23.7 


29.4 
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22.3 


20.1 
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4 


4 
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TGG 


13.7 


11.5 


13.7 


10 


10 
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Nel fare questo si e tenuto anche nella giusta 
cons iderazi one il valore G+C e A+T dei due sistemi 
(uomo e vegetale) , della non ripetizione contigua 
di alcune triplette che possono portare a fenomeni 
di slittamento di lettura, ecc. 

II gene LFU sintetico e stato quindi ottenuto 
utilizzando i primer riportati nella lista di 
sequenze annesse da SEQ ID NO: 8 a SEQ ID NO: 12 e 
da sequenza SEQ ID NO: 15 a SEQ ID NO: 20 e 
seguendo la strategia di assemblaggio riportata in 
figura 1 che consisteva nell ' eseguire ripetuti 
cicli di PCR, utilizzando per ogni ciclo diverse 
coppie di primers sintetici che consentissero 
1 ' allungamento progressivo e la formazione della 
sequenza finale come progettata. 

Parallelamente e stato anche clonato il gene 
LFU nativo (wild type) che codifica per la 
lattoferrina umana, sempre con tecnica PCR/ a 
partire da una libreria a cDNA di tessuto mammario 
umano (Clontech) . II gene d stato recuperato nella 
sua parte strutturale priva del peptide segnale e 
del sito poli-A e clonato in pGEM-T a formare il 
plasmide pGEM-LFU la cui mappa e rappresentata in 
figura 7. I primer disegnati per 1 ' amplif icazione 
sono riportati, nella lista di sequenze annessa, 
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alle sequenze SEQ ID NO: 2 e SEQ ID NO: 3; questi 
aggiungevano all ' estremita 5' il sito di 
restrizione BamHI e in 3' il sito di restrizione 
Sacl. Il gene naturale ottenuto, dopo controllo 
della sequenza, che e risultata identica a quella 
pubblicata, e stato clonato nel vettore pBI121, nei 
siti BamHI e Sacl, sotto controllo del promotore 
35S (vedi figura 7) , questo plasmide (pBI-LFU) e 
stato successivamente indicato come pBI-35S-LFU e 
utilizzato come controllo negli esperimenti di 
trasformazione genetica delle piante e successiva 
analisi molecolare e biochimica. 

Per quanto riguarda la preparazione dei 
vettori ricombinanti contenenti gli element i che 
consentono la espressione tessuto specifica del 
gene LFU in "cassette di espressione per piante" , 
si e proceduto come segue. Al fine di ottenere 
1' espressione seme-specif ica della proteina si sono 
utilizzati i promotori e le sequenze segnale 
appartenenti a due geni che codificano per proteine 
di riserva molto abbondanti nei semi di soia e cioe 
una p-conglicinina (CONG) e una globulina basica 7S 
(GLOB) . 

Queste sequenze di regolazione sono state 
isolate e donate dalla varieta di soia Richland. 




In particolare per il clonaggio delle due sequenze 
GLOB e CONG e stata utilizzata la tecnica della 
reazione di polimerizzazione a catena (PCR 
Polimerase Chain Reaction; Innis et al . 1990). In 
questo caso si e utilizzato DNA genomico estratto 
da foglie di soia delle cultivar Richland. Gli 
oligonucleotidi utilizzati per 1 ' amplif icazione 
specifica sono riportati nella lista di sequenze 
annessa da SEQ ID NO: 4 a SEQ ID NO: 7. 

Per il promotore GLOB la regione clonata 
comprende tutta la sequenza regolatrice e la 
sequenza che codifica per il peptide segnale 
(leader) piu il primo codone della sequenza 
strutturale, tale sequenza d indicata come SEQ ID 
NO: 13 nella lista di sequenze annessa. Per il 
promotore CONG la regione clonata comprende tutta 
la sequenza regolatrice e la sequenza che codifica 
per il peptide segnale piu il primo codone della 
sequenza strutturale, tale sequenza e indicata come 
SEQ ID NO: 14 nella lista di sequenze annessa. Per 
entrambe le sequenze di regolazione il sito di 
restrizione piu idoneo da inserire e risultato Xbal 
(TCTAGA) , mentre a valle e" risultato BamHI 
(GGATCC) , entrambi assenti nella sequenza della 



AccI 
Alwl 
AlwNI 
Aos I 
Aval 
Avail 
Ball 
BanI 
Banll 
Bbvl 
cnl 
gll 
Bglll 
BsmI 
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BspMI 
BstUI 
BstXI 
BSU36I 
Ddel 
Dpnl 
Drall 
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EcoNI 
ECOO109 
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Fnu4HI 
Fokl 
Fspl 
HgiAI 
Hhal 
Hinfl 
HinPlI 
Hpall 
HphI 
Mael 
Maell 
Maelll 
MboII 
Neil 
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lattof errina, sia naturale che sintetica come vi 
evidenziato nelle seguenti tabelle 2 e 3 . 

TAB ELLA 2 



1 
2 
1 
1 
4 
6 
2 
4 
2 
S 
5 
3 
2 
1 
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1 
1 
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TAB ELLA 2 (continuazione) 

Ncol 3 + — r + # # # _ + _ 

Ndel 1 + + #+ _ 

Nlalll ' 7 + # + # # 

Plel 3 + 1 #— + 

PpuMI 2 + r-# + 

PstI 2 + + / # 

PvuII 4 + — # # + 

Rsal 3 + # #-+ # 

Sau3AI 5 + # + #-# # # + _ 

Saul l + + 

SfaNI 4 + # # +— ## +- 

Smal l + # + +_ 

Sspl 2 + + # #+- 

StuI 2 + i # + +- 

Styl 4 + #-+-—• # # 

TaqI 2 + # — + # +- 

XhoII 3 .+ # + # # +- 

al 1 + f + +- 



tr — I — 

+- 

+- 

+- 

+- 



0m. 
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TAB ELLA 3 

0 1000 2000 

+ + +" 

AccI 1 + # ~~~~~~~~~~~~~~ +~ 

AccIII 1 + +~ 

AluI 10 #— #— # #—+---#--- # #-2--— + - 

Alwl 5 + # # +-/ # ~ # +" 

Aosl 2 +# + # " " + ~ 

Asul 7 +~ # #—## # + # # + - 

Avall 6 +~# #— ## # # + - 

Avrll 1 + # ~ + ~~~ + ~ 

BanI 2 + # + — ~ # ____~~~~ + "~ 

Banll 2 + # + " "~~ # ~ " ~ + ~ 

Bbvl 3 + # # # ~ + " 

Bcnl 2 + # " + ~ 

Bgn 2 + — — # ""::::+:::::::::::::::::::::::::::+: 

Bglll 2 + # + * _ _____ 

sml 2 + # + ~~ _„T~_~_ !_"___ 

s P 1286 5 + — # # +- _ 

BspMI 3 + ~~ + .-_ _ 

BspMII 1 + # ~ + ~~ „ ~T~ 

BstNi 6 + — # #-# + — * — # — # — 

BstUI 1 + zrz I- 

BstXI 3 + # +~#-#- ~ +~ 

BSU36I 1 "+ + ~ ~ „~] 

cfri3i 7 +— # — #— ## # + r~r — ztz 

Ddel 7 + ## # ™ --#-+# 

Dpnl 8 +—-. # # # +"# * ~ 

Drall 1 + # + " T7 

Drain 2 + # + .- Ij 

Eco81I 1 + + " " + 

EcoNI 1 + + # ' " ~ 

ECOO109 1 + # + ~_ " Z 

ECORI 1 + + ~ " " _ _ V 

EcoRii 6 + # #-# + r Z "_~ Z +_ 

EcoRV 1 + + # " " " - 

>nu4HI 4 + # # # " # " T 

>okI 5 + # # # # + # ———-—+ 

Fspl 2 +# " . 

Haelll 4 +## +~ * " * . 

HgiAi 2 +- # 

Hhal 3 +# ## 

Hindi 1 + # + ~ 

Hindlll 1 + + # ~~ "T^ 

Hinfl 8 + ## # #--##-+ # # ~T" 

HinPlI 3 +# ## 



60 



TABELLA 3 (continuazione) 



Hpall 3 + '■ ## 

HphI 3 +— i f + # 

Mael 5 + #-#-+ # j 

Maell 2 + + # — #• 

Maelll 9 + # # # +-2 # 



-+- 

•+# 
•+- 
•+- 



+- 
+- 



MboII 6 + -# # #-# + # # 

Msel 2 + # # + 

Neil 2 + # # + _ 

Ncol 3 + : + # # 

Ndel 1 + + 

Nlalll 8 + # #- + # # #-## #-+_ 

Plel 3 + # # — + 

PpuMI 1 + # + +_ 

PstI 2 + + # # +- 

>vull 2 + # # + — . +- 

tsal 2 + # +- 

Sau3AI 8 + #- # # +-# — --#-# # # +- 

Sau9 6I 7 +— # #— ## f + # #+- 

Saul 1 + + +# 

ScrFI 8 + # #-# # # # # # +- 

SfaNI 4 + #- # + — ## +- 

Sspl 2 + + # #4~ 

Styl 5 + 2-+ . # # #-+- 

TaqI 2 + # — + # +- 

XhoII 6 + " # # # +-# # # +- 
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II DNA stampo e" stato estratto da foglie di 
Glycine max varieta Richland e i prodotti 
dell ' amplif icazione corrispondono alle dimensioni 
attese per il promotore GLOB (1515 pb) e CONG 
(1163) in base ai dati di sequenza EMBL. 

A partire dai frammenti amplif icati, mediante 
ligazione nel vettore pGEM-T, sono stati quindi 
costruiti i due vettori pGEM-PGLOB e pGEM-PCONG la 
cui mappa e riportata in f igura 2 . I plasmidi 
ottenuti sono stati controllati mediante analisi di 
restrizione con diversi enzimi scelti fra quelli 
che tagliano in numero limitato e con distribuzione 
su tutta la sequenza (vedi figure 3, 4 e 5) e un 
clone per tipo e stato scelto e sequenziato. I 
cloni sequenziati si sono rilevati 

signif icativamente diversi dalla sequenza attesa. 
In figura 6 viene riportato, come esempio, il 
confronto del la sequenza del promotore CONG 
presente in banca dati con quella ottenuta 
sequenziando il clone pGEM-PCONG, la differenza e 
pari al 5% e quindi i due promotori possono essere 
considerati diversi. 
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Il gene sintetico per la lattoferrina umarfap e *e 
stato clonato prima nei plasmidi pGEM-PGLOB e 
PCONG, tagliati con gli enzimi BamHI-SacI, 





formare i plasmidi pGEM - PGLOB - LFU e pGEM-PCONG-LFU 
rispettivamente, la cui mappa e esposta in figura 
8, e poi il tratto Xbal-SacI trasferito nel vettore 
pBHOl tagliato con gli stessi enzimi. Nel caso di 
trasf ormazione dei vegetali con metodi fisici, come 
da noi eseguito per il riso, e qui non riportato, e 
possibile utilizzare direttamente i plasmidi pGEM- 
PGLOB-LFU e pGEM-PCONG-LFU, dopo aver aggiunto un 
terminatore, in cot rasf ormazione con un vettore 
contenente il marcatore di selezione (es. un 
vettore del tipo pUC contenente il gene per la 
resistenza all ' Igromicina) . I plasmidi risultanti 
pB I -PGLOB -LFU e pBI-PCONG-LFU, la cui mappa e 
riportata in figura 9, dopo accurato controllo 
mediante restrizione con diversi enzimi per 
verificare la corretta integrazione del tratto di 
DNA (figure 10 e 11) , sono stati usati per la 
trasf ormazione genetica delle piante. I plasmidi 
PBI-35S-LFU, pBI-PGLOB-LFU e pBI -PCONG-LFU sono 
stati trasf eriti in cellule del ceppo di A. 
tumefaciens EHA105, rese competenti, mediante 
elettroporazione . I ceppi con i tre plasmidi sono 
stati utilizzati per trasformare circa 450 dischi 
fogliari di tabacco var. Petit Avana . Dai calli 
formatisi sui dischi fogliari in presenza di 




kanamicina si e indotta la formazione prima di 
germogli e poi di radici. Una volta radicate le 
piante sono state trasferite in vaso e per ogni 
costrutto si sono analizzate almeno 50 piante 
kanamicina resistenti. 

Le piante T 0 sono state controllate mediante 
tecnica PCR (figura 12) , che ha consentito di 
verificare la presenza, all'interno del genoma 
delle piante analizzate, del gene lattof errina; le 
piante T x sono state controllate mediante analisi 
Southern (figura 13) , che consente un controllo piu 
preciso, della tecnica PCR, della presenza del 
transgene nel genoma e con analisi Western (figura 
14) che consente di rilevare la presenza del 
prodotto genico e quindi la funzionalit^ del gene 
inserito. 

Le piante con il gene LFU naturale sot to 
controllo del promotore 35S portavano tutte 
all'accumulo di una proteina, riconosciuta dagli 
anticorpi specifici per la LFU, di peso molecolare 
inferiore a 50 Kda. Questa proteina era presente 
nelle foglie giovani in piccola quantita e non era 
piu evidenziabile nelle foglie completamente 
sviluppate. Le piante trasformate con i due 
cost rut ti pBI-PGLOB-LFU e pBI -PCONG-LFU producono 
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ed accumulano solo nel seme una proteina di peso 
molecolare pari a 82 Kda correspondent e alia 
proteina umana glicosilata come e risultato 
dall'analisi elettrof oretica delle proteine 
estratte e dal relativo Western Blotting eseguito 
con anticorpi specifici per LFU (vedi figura 15) . 
La presenza della proteina ricombinante solo nel 
seme e non nelle foglie e stata verificata in tutte 
le piante transgeniche esaminate (circa 50 per i 
due costrutti) con tecniche Western. 

La proteina LFU ricombinante isolata da seme e 
purificata con tecniche HPLC si e dimostrata 
identica alia proteina naturale per quanto riguarda 
la sua capacita di legare il ferro e il suo effetto 
inibitore verso i ceppi batterici esaminati. Il 
trattamento con un enzima deglicosilante conferma 
la presenza di modif icazioni posttraduzionali del 
tuttp simili, al momento almeno in termini 
quantitativi , a quelle presenti nella lattoferrina 
nativa come evidenziato dall'analisi Western 
Blotting i cui risultati sono esposti in figura 16. 

Dai risultati sopra riportati risulta quindi 
evidente che utilizzando il gene nativo, descritto 
in letteratura, per la lattoferrina umana sotto 
controllo dei promotori classici utilizzati per la 




65 



trasformazione genetica dei vegetali, non e 
possibile produrre la proteina umana lattoferrina 
in quantita significative, in forma stabile e con 
le modif icazioni posttraduzionali tipiche di questa 
proteina . 

Si e data finora della presente invenzione una 
descrizione di carattere generale. Con l'aiuto dei 
seguenti esempi verra ora fornita una descrizione 
piu dettagliata di sue specifiche forme di 
realizzazione, finalizzate a farne meglio 
comprendere scopi, caratteristiche, vantaggi e 
modalita operative. 

ESEMPIO 1: 

Trasf ormazione del tabacco mediata da Agrobacterium 
Tumef aciens 

1° giorno: in 2 ml di LB sterile, § stata inoculata 
una piccola quantita di Agrobatterio tumefaciens 
del ceppo EHA 105, prelevata da una coltura s 
piastra petri con un'ansa sterile, in modo da 
eccedere nella quantita per evitare success 
problemi di controllo di prolif erazione batteri 
sui dischi fogliari su piastra. Successivamente e 
stata prelevata da una pianta sana di tabacco 
varieta Petit Avana, una foglia che non presentava 




alterazioni di sorta e che manifestava per converso 
condizioni ottimali di turgore. La foglia § stata 
sciacquata brevemente in acqua bidistillata per 
eliminare le impurita superficial! , immersa in una 
soluzione di sodio ipoclorito 20 % e SDS 0,1 % per 
8 min, e lasciata asciugare sotto cappa a flusso 
verticale. Da questo raomento, tutte le operazioni 
sono state eseguite sotto cappa. In particolare la 
foglia e stata immersa in etanolo 95 % e agitata in 
modo da bagnarne completamente le due pagine 
(lasciando fuori dal liquido il picciolo) , per 30 - 
40 sec. La foglia e stata poi lasciata asciugare 
perf ettamente . 

Con una punzonatrice sterilizzata in etanolo, 
sono stati ricavati dischetti da tutta la 
superficie fogliare, facendoli cadere su piastre 
con MS10 privo di antibiotici; in particolare non 
sono stati posti piu di 30 dischetti per piastra. 
Success ivamente 2 ml di LB + agrobatterio (appena 
innoculato) sono stati versati sulla piastra, e la 
sospensione batterica sparsa unif ormemente su tutta 
la piastra con dolce movimento rotatorio, in modo 
da ottenere una omogenea distribuzione dei batteri 
tra i dischetti. L'eccesso di LB e stato aspirato 
con cura con una pipetta. Nello svolgimento di 




queste operazioni si e sempre avuto cura di 
eseguire un controllo negativo in parallelo con una 
piastra a cui non si aggiunge nulla, o solo LB. 
Le piastre sono quindi state incubate per 24-4 8 ore 
a 28 °C, ad illuminazione costante e la crescita 
dei batteri e stata indicata dalla comparsa di un 
sottile alone opaco diffuso su tutta la piastra. 
2° Giorno 

I dischi fogliari (=LD) sono stati trasferiti 
con cura su una piastra con MS10 + cephotaxime 50 0 
mg/1, e incubati per 6 giorni a 28°C, in 
illuminazione costante. Questo passaggio determina 
la inattivazione dell ' agrobatterio. 

8° giorno 

I dischi fogliari sono stati quindi trasferiti con 
cura su MS10 + cephotaxime 500 mg/1 e Kanamicina 
200 mg/1, ed incubati per 14 giorni a 28°C, in 
illuminazione costante. Questo passaggio ha 
determinato la selezione delle piante trasformate: 
il gene della resistenza alia Kanamicina e infatti 
portato dal plasmide inserito in Agrobacterium. 
22° Giorno 

I dischi fogliari che nel frattempo si sono 
accresciuti, formando callo, sono stati trasferiti 
con cura su MS10 + cephotaxime 500 mg/1, Kanamicina 




200 mg/1 e carbenicillina 500 mg/1, e incubati 
per 6 giorni . Questo passaggio determina la 
eliminazione degli agrobatteri eventualmente 
soprawissuti ai precedenti trattamenti con 
antibiotico (caso molto frequents) . 
28° Giorno 

I dischi fogliari sono stati nuovamente 
trasferiti su MS 10 + cephotaxime 500 mg/1 e 
kanamicina 200 mg/1, ed incubati fino alia comparsa 
dei germogli. Quando i germogli presentavano almeno 
due foglie, sono stati separati dalla massa callosa 
e trasferiti sul terreno per la radicazione: MSO + 
cephotaxime 500 mg/1 e kanamicina 200 mg/1. 

Al momento della comparsa delle radici, le 
piantine sono state estratte dalla piastra, 
liberate dai residui di agar, sciacquate 
delicatamente in acgua corrente e poste a dimora in 
piccoli vasi di plastica, in terriccio e sabbia 
(2:1). II terreno e stato prevent ivamente saturate 
d'acqua, in seguito i vasetti sono stati coperti 
con coperchi di plastica trasparente per mantenere 
condizioni di elevata umidita, e sono stati posti 
in camera di crescita a temperatura ambiente, con 
un periodo giornaliero di illuminazione di 16 ore. 
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ESEMPIO 2 : 

Purif icazione della proteina lattoferrina da 
tessuti diversi della pianta e verifica del peso 
molecolare . 

L'estrazione di tutte le proteine del seme di 
tabacco e stata eseguita macinando i semi in azoto 
liquido in presenza di un tampone di estrazione 
(0,5 M saccarosio, 0,1% acido ascorbico, 0,1% Cys- 
HC1, 0,01 M Tris-HCl, 0,05M EDTA pH 8). 

La soluzione veniva poi centrifugata per 3 0 
minuti a 14.000 g a 4°C e si conservava il 
surnatante con le proteine solubili. 

La soluzione veniva poi filtrata con filtri di 
porosita 0,2 urn e la lattoferrina parzialmente 
purificata eliminando le proteine di peso 
molecolare inferiore a 30 KDa mediante 
centrifugazione in colonnina Centricon 30 (Amicon) . 

La lattoferrina veniva ulteriormente 
purificata mediante cromatrograf ia HPLC su colonna 
Resource Q (Pharmacia) a scambio cationico debole, 
con eluizione in tampone fosfato pH 7 e gradie, 
NaCl 20-100%. II picco corrispondente 
lattoferrina eluiva a 0,7 M NaCl . 

Le frazioni del range di eluizione veniva 





riunite e filtrate in Centricon 30 per eliminare il 
sale . 

Per l'estrazione della lattoferrina dalle 
foglie di tabacco si procedeva come per 
l'estrazione da seme fino alia centrifugazione, il 
surnatante veniva poi addizionato di (NH 4 ) 2 S0 4 al 
60% e lasciato in agitazione per 60 min in 
ghiaccio. 

Si centrifugava poi la soluzione a 14.000 g 
per 15 minuti a 4°C e si recuperava il precipitato 
poi risospeso in tampone fosfato pH 6,8. 

Per la verifica del peso molecolare in SDS- 
PAGE, al campione di lattoferrina <20jxl) si 
aggiungeva il colorante (SDS loading buffer) e si 
caricavano i campioni su minigel di poliacrilamide 
all '8%. Le condizioni di corso erano: 10mA iniziali 
e 20 mA per tutta la corsa, in tampone Tris-glicina 
lx. II gel veniva poi colorato con tecnica Silver 
staining e il peso molecolare calcolato in 
rif erimento a standard di peso molecolare . 

ESEMPIO 3: 

Analisi Western delle proteina lattoferrina 
prodotta in pianta e deglicosilazione della stessa . 




La lattoferrina purificata da seme secondo 
l'esempio 2, dopo separazione elettrof oretica in 
gel di acrilamide, veniva trasferita mediante 
elettroblotting (tampone 25mM Tris, 192 mM Glicina, 
20% metanolo, 45 V a 4°C) su membrana di 
nitrocellulosa (BA85 Schleicher e Schull) . 

La membrana con la proteina immobilizzata 
veniva posta in agitazione per 60 min in soluzione 
TBS-T e 5% Skin milk e successivamente, dopo alcuni 
lavaggi, con la stessa soluzione contenete 
l'anticorpo primario in proporzione 1:2500. 

Dopo la reazione con l'anticorpo primario la 
membrana veniva lavata e poi posta a contatto 
dell ' ant icorpo secondario (Anti -Rabbit peroxidase 
coniugate) , sempre in soluzione TBS-T Skin milk, in 
proporzione 1:12.000. 

Dopo la reazione con l'anticorpo secondario la 
membrana veniva lavata diverse volte e posta a 
contatto le soluzioni del kit ECL per 
chimioluminescenza della Amersham. 

La membrana veniva poi esposta a contatto con 
una lastra fotografica (Hyperfilm MP, Amersham) in 
camera oscura per tempi variabili. 

La deglicosilazione con l'enzima N-glicosidase 
F (Boehringer Man.) veniva eseguito utilizzando 10 




Hi di volume di glicopeptide (10 ug) denaturato in 
0,1% SDS portato a ebollizione per 2 min. 

A questa soluzione si aggiungevano 90 di 
tampone (20 mM tampone fosfato pH 7,2, 50 mM EDTA 
pH 8, 10 mM sodio azide, 0,5& NP40, 1% p- 
mercaptoetanolo) e si portava ancora una volta a 
ebollizione per 2 min e poi si raffreddava a 37°C. 

Ai 100 ul si aggiungeva 1 U di N glicosidase F 
e si lasciava incubare a 37°C per 18 ore. II 
prodotto della reazione veniva poi analizzato su 
gel SDS-PAGE e la proteina lattoferrina rilevata 
mediante tecnica Western. 

GLOSSARIO 

II termine "polinucleotide ricombinante" , come 
qui utilizzato per caratterizzare un 

polinucleotide utile per la produzione di 
lattoferrina, si riferisce ad un polinucleotide di 
origine genomica, cDNA, semisintetico o sintetico 
che, in virtu della sua origine o manipolazione : 1) 
non e associato con una parte o con la total ita del 
polinucleotide con il quale esso e associato in 
natura, e/o 2) e legato ad un polinucleotide che e 
diverso da quello al quale e associato in natura o 
che 3) non esiste in natura. 
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II termine "polinucleotide" , come qui 
utilizzato, si riferisce ad una forma polimerica di 
nucleotidi di qualsiasi lunghezza, sia 
ribonucleotidi che deossiribonucleotidi . Questo 
termine si riferisce unicamente alia struttura 
primaria della molecola. Cosi, il termine include 
DNA a singola e doppia elica cosi come RNA a singola 
e doppia elica. Esso include pure forme del 
polinucleotide modificate, per esempio per 
metilazione, fosforilazione o "capping" , e forme non 
modi fi cat e . 

Una "cassetta di espressione per piante" si 
riferisce ad una sequenza polinucleotidica 
ricombinante ottenuta legando assieme in modo 
operativo diversi elementi costituiti dalle sequenze 
polinucleotidiche che determinano 1 ' espressione di 
un carattere in pianta, e che sono facilmente 
trasferibili, come tratti discreti, da un vettore 
all'altro mediante restrizione enzimatica. A' 

Un "vettore" e un replicone in cui un aljfipo 

jj° 

segment o polinucleotidico viene aggiunto, in m$|o 
che si effettui la replicazione e/o espressione d 
segmento stesso. 

Un "replicone" e qualsiasi elemento genetico, 
per esempio un plasmide, un cromosoma, un virus, che 





si comporta come un'unita autonoma di replicazione 
polinucleotidica all* interne di una cellula; e 
quindi capace di replicarsi in modo autonomo. 

"Sequenza di controllo" si riferisce a sequenze 
polinucleotidiche che sono necessarie ad effettuare 
1 ' espressione e/o la secrezione di sequenze 
codificanti a cui esse sono legate. La natura di 
queste sequenze di controllo dif ferisce a seconda 
dell 'organismo ospite; nei procarioti, queste 
sequenze di controllo generalmente includono 
promotore, sito di legame dei ribosomi e 
terminatori ; negli eucarioti, generalmente queste 
sequenze di controllo includono promotori, 
terminatori e, in alcuni casi, gli enhancers. In 
aggiunta, sia nei procarioti che negli eucarioti, 
sequenze leader controllano la secrezione da parte 
della cellula ospite del polipeptide espresso. 1 
termine "sequenze di controllo" include, come 
minimo, tutti i component i la cui presenza e 
necessaria per 1 * espressione, e pud anche includere 
component i addizionali la cui presenza e 
vantaggiosa, ad esempio sequenze leader. 

Una sequenza "leader" e un tratto 
polinucleotidico, solitamente breve, che codifica 
per un segnale di trasporto della proteina a questo 




fusa e che guida il trasf erimento della proteina in 
compart imenti specif ici della cellula. Se il 
trasf erimento awiene attraverso il reticolo 
endoplasmico la proteina subisce specifiche 
modifiche posttrascrizionali . 

"Legato opera tivamente" si riferisce ad una 
giustapposizione in cui i component i sopra descritti 
sono in una relazione tale da permettere loro di 
funzionare nel modo atteso. Una sequenza di 
controllo "legata opera tivamente" ad una sequenza 
codificante e legata in tale modo che 1 • espressione 
della sequenza codificante si realizza in condizioni 
che sono compatibili- con le sequenze di controllo. 

Una "seguenza di lettura aperta" (open reading 
frame, ORF) e una regione di una sequenza 
polinucleotidica che codifica per un polipeptide; 
questa regione pud rappresentare una porzione di 
sequenza codificante o una sequenza codificante 
completa . 

Una "sequenza codificante" e" una sequenza 
polinucleotidica che e trascritta in mRNA e/o 
tradotta in polipeptide quando posta sotto controllo 
di appropriate sequenze di regolazione. Gli estremi 
della sequenza codificante sono determinati da un 
codone di inizio della traduzione all ' estremita 5' e 



da un codone di arresto della traduzione 
all 'estremita 3'. Una sequenza codificante pud 
includere, ma non si limita a , mRNA, cDNA, e 
sequenze polinucleotidiche ricombinanti . 

"Cellule ospiti ricombinanti", "cellule 
ospiti", "cellule", "linee cellulari", "colture 
cellulari" ed altri termini che denotano 

microorganismi o linee cellulari di eucarioti 
superiori, coltivate come entita unicellulari , sono 
qui utilizzati in modo intercambiabile . Essi si 
riferiscono a cellule che possono essere, o sono 
state, usate come ospiti per vettori ricombinanti o 
altri polinucleotidi di trasf erimento, e includono 
la progenie della cellula che e stata in origine 
trasf ormata. E' implicito che la progenie di una 
singola cellula parentale pud non essere 
necessariamente identica dal punto di vista 
morfologico e genet ico al parentale originario, a 
causa di mutazioni accidentali o deliberate. Le 
progenie della cellula parentale che sono 
suf f icientemente simili al progenitore e possono 
essere caratterizzate per la proprieta saliente, 
come la presenza di una sequenza nucleotidica 
codificante per il peptide di interesse, sono 




incluse nella progenie intesa in questa definizione 
e rientrano negli stessi termini. 

Per "aggregate? cellulare" si intende un insieme 
di cellule non strutturate in un tessuto organizzato 
ma frutto di una proliferazione indif ferenziata di 
cellule mantenute in particolari condizioni di 
concentrazione ormonale. 

"Trasformazione" , come qui utilizzato, si 
riferisce all ' inserzione di un polinucleotide 
esogeno in una cellula ospite, indipendentemente dal 
metodo usato per 1' inserzione stessa, ad esempio 
acquisizione diretta, infezione con Agrobacterium, 
gamia. II polinucleotide esogeno pud essere 
mantenuto come vet tore non integrato, per esempio un 
plasmide o, in alternativa, pud integrarsi nel 
genoma dell 'ospite. 

Come qui utilizzato, il termine "polipeptide" 
si riferisce al prodotto aminoacidico di una 
sequenza codificata all'interno di un genoma e non 
si riferisce ala lunghezza specif ica del prodotto: 
cosi, peptidi, oligopeptidi e proteine sono inclusi 
nella def inizione di polipeptide. Questo termine non 
si riferisce alle modif icazioni post-espressione d&jfc, 
polipeptide, per esempio glicosilazione, 

acetilazione, fosforilazione, sialilazione e simili. 




Un "polipeptide naturale" , (wi Id type), presenta 
una sequenza aminoacidica identica a quella 
codificata nel genoma dell 1 organismo che e la 
sorgente della sequenza codificante. 

"Lattoferrina nativa" e termini analoghi si 
riferiscono alia lattoferrina isolata dalla sorgente 
in cui essa e normalmente prodotta in natura da un 
genoma naturalmente presente. 

Un "polipeptide non nativo" si riferisce ad un 
polipeptide che e prodotto in un ospite di verso da 
quello da cui £ prodotto in natura . 
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LISTA DI SEQUENZE 



INFORMAZIONI GENERAL I : 

(i) DEPOSITANTE: PLANTECHNO S.R.L. 

(ii) TITOLO DELL' INVENZIONE : 

* POL I NUCLEOTIDE SINTETICO COD I F I CANTE PER LA 
LATTOFERRINA UMANA, VETTORI , CELLULE E PI ANTE 
TRANSGENI CHE CHE LO CONTENGONO" 

(iii) NUMERO DI SEQUENZE: 22 

(iv) INDIRIZZO DI CORRISPONDENZA: 



(A) DESTINATARIO: Societa Italiana Brevetti 

(B) INDIRIZZO: Piazza di Pietra, 39 

(C) CITTA: Roma 

(D) PAESE: Italia 

(E) CODICE POSTALE: 1-00186 



<v) FORMA LEGGIBILE AL CALCOLATORE : 

(A) TIPO DI SUPPORTO: 

(B) COMPUTER: IBM PC compatibile 

(C) SISTEMA OPERATIVO: PC-DOS/MS-DOS Rev. 5-0 

(D) SOFTWARE: Microsoft Word 6.0 
(viii) INFORMAZIONI SULL ' AGENTE 



(A) NOME: BORRINI , Stefano (Dott 




(B) RIFERIMENTO: IN- SB 



(ix) 



INFORMAZIONI PER TELECOMUNICAZIONI 



(A) TELEFONO: 06/6785941 



(B) TELEFAX: 06/6794692 



(C) TELEX: 



612287 ROPAT 




(1) INFORMAZIONI SULLA SEQUENZA SEQ ID NO: 1: 

(i) CARATTERI STI CHE DELLA SEQUENZA 

(A) LUNGHEZZA: 2079 bp 

(B) TIPO: acido nucleico 

(C) NUMERO DI CATENE : doppia 

(D) TIPOLOGIA: lineare 

(ii) TIPO DI MOLECOLA: DNA 
(ix) CARATTERI STI CHE ULTERIOR I 

(A) NOME: LFUSYN 

(xi) DESCRIZIONE DELLA SEQUENZA SEQ ID NO : 1: 

GGC CGT AGG AGA AGG AGT GTT CAA TGG TGC GCA GTA TCA CAA CCA 4 5 
GRRRRSVQWCAVSQP 

GAG GCC ACA AAA TGC TTC CAA TGG CAA AGG AAT ATG AGA AAA GTT 90 
EAT KCFQW QRN M R KV 

CGT GGA CCT CCT GTA TCT TGC ATA AAG AGA GAT TCA CCC ATC CAG 135 
RGPPVSCIKRDSPIQ 

TGT ATC CAG GCA ATT GCG GAA AAC AGA GCT GAT GCT GTG ACT CTT 180 
C I QAIAENRADAVTL 

GAT GGT GGT TTC ATA TAC GAG GCA GGA CTT GCC CCA TAC AAA CTG 225 
DGGFIYEAGLAPYKL 

CGA CCT GTA GCG GCG GAA GTC TAC GGG ACC GAA AGA CAA CCA CGA 270 
R PVAAEVYGTERQPR 

ACT CAC TAT TAT GCT GTG GCT GTT GTG AAG AAG GGC GGA TCT TTT 315 
THYYAVAVVKKGG SF 

CAG CTG AAC GAA CTT CAA GGT CTG AAG TCA TGC CAC ACA GGA CTT 360 
Q L~N E L Q G L KS C H T G L 

CGC AGG ACC GCT GGA TGG AAT GTC CCT ATA GGG ACA CTT CGT CCA 4 05 
RRTAGWN VPIGTLRP 



TTC TTG AAT TGG ACG GGT CCA CCT GAG CCC ATT GAG GCA GCT GTG 450 
FLNWTGPPEP I E A A V 




GCA AGA TTC TTC TCA 

A R F F S 

CAA TTC CCC AAC CTT 

Q F P N L 

AAA TGT GCA TTC TCA 

K C A F S 

GCC TTT AAG TGT CTT 

A F K C L 

AGA GAG AGC ACA GTG 

R E S T V 

GAC GAG TAT GAG TTA 

D E Y E L 

GAC AAG TTC AAA GAT 

D K F K D 

GTT GTG GCA CGA AGT 

V V A R S 

CTT CTC CGC CAA GCA 

L L R Q A 

AAA TTC CAG CTC TTT 

K F Q L F 

TTC AAG GAC TCT GCC 

F K D S A 

GAT TCT GGG TTG TAC 

D S G L Y 

AAC TTG AGG AAA AGT 

N L R K S 

GTC GTT TGG TGT GCG 

V V W C A 

CAG TGG AGT GGT TTG 

Q W S G L 

TCC ACT ACA GAA GAT 

S T T E D 

GAT GCC ATG AGT TTG 

D A M S L 

TGT GGT TTG GTG CCT 
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GCC TCT TGT GTT CCA GGT 
A S C V P G 

TGT CGC CTG TGT GCG GGG 
C R L C A G 

TCC CAG GAA CCG TAC TTC 
S Q E P Y F 

AGA GAC GGT GCT GGA GAT 
R D G A G D 

TTT GAG GAT CTT TCA GAC 
F E D L S D 

CTC TGC CCA GAC AAC ACT 
L C P D N T 

TGC CAT CTT GCA CGG GTC 
C H L A R V 

GTT AAT GGA AAG GAG GAT 
V N G K E D 

CAG GAA AAG TTT GGA AAG 
Q E K F G K 

GGT TCC CCT AGT GGG CAG 
G S P S G Q 

ATT GGG TTT TCG AGA GTG 
I G F S R V 

CTT GGC TCC GGA TAC TTT 
L G S G Y F 

GAG GAG GAA GTT GCT GCC 
E E E V A A 

GTG GGA GAG CAA GAG TTG 
V G E Q E L 

AGC GAA GGA TCT GTG ACC 
S E G S V T 

TGC ATC GCC CTG GTG TTG 
C I A L V L 

GAT GGA GGA TAT GTT TAC 
D G G Y V Y 

GTC CTT GCA GAG AAC TAC 




GCA GAT AAA GGA 4 95 
A D K G 

ACA GGG GAA AAC 540 
T G E N 

AGC TAC TCT GGT 585 
S Y S G 

GTT GCT TTT ATT 630 
V A F I 

GAG GCT GAA AGG 675 
E A E R 

CGT AAG CCA GTT 720 
R K P V 

CCT TCT CAT GCC 765 
P S H A 

GCC ATC TGG AAT 810 
A I W N 

GAC AAG TCA CCG 855 
D K S P 

AAA GAT CTT CTG 900 
K D L L 

CCA CCT AGG ATA 945 
P P R I 

ACT GCA ATT CAG 990 
T A I Q 

CGG CGT GCG CGG 1035 
R R A R 

CGC AAG TGT AAC 10 80 
R K C N 

TGC TCA TCG GCC 1125 
C S S A 

AAA GGA GAA GCT 1170 
K G E A 

ACT GCA GGT AAA 1215 
T A G K 

AAA TCA CAA CAA 1260 
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CGLVPVLAENYKSQQ 

AGC AGT GAC CCT GAT CCT AAC TGT GTG GAT AGA CCT GTG GAA GGA 1305 
S SDPDPNCVDRPVEG 

TAT CTT GCT GTG GCG GTG GTT AGG AGA TCA GAC ACT AGC CTT ACC 1350 
Y LAVAVVRRS D T S LT 

TGG AAC TCT GTG AAA GGC AAG AAG TCC TGC CAC ACC GCC GTG GAC 13 95 
WNSVKGKKSCHTAVD 

AGG ACT GCA GGT TGG AAT ATC CCC ATG GGA TTG CTC TTC AAC CAG 144 0 
RTAGWNIP MGLLFNQ 

ACG GGC TCC TGC AAA TTT GAT GAA TAT TTC AGT CAA AGC TGT GCC 14 85 
TGSCKFDEYFSQSCA 

CCT GGT TCT GAC CCA AGA TCT AAT CTC TGT GCT TTG TGT ATT GGA 153 0 
PG SDPRSN LCALCI G 

GAT GAG CAA GGT GAG AAT AAG TGC GTT CCC AAC AGC AAC GAG AGA 1575 
DEQGENKCVPNSNER 

TAC TAC GGT TAC ACT GGG GCT TTC CGT TGC TTG GCT GAG AAT GCT 1620 
YYGYTGAFRCLAENA 

GGA GAC GTT GCA TTT GTG AAA GAT GTC ACT GTC TTG CAG AAC ACT 1665 
GDVAFVKDVTVLQNT 

GAT GGA AAT AAC AAT GAG GCA TGG GCT AAG GAT TTG AAG CTT GCA 1710 
DGNNNEAWAKDLKLA 

GAC TTT GCG TTG CTG TGC CTC GAT GGC AAA CGT AAG CCT GTG ACT 1755 
D FALLCLDG KR KPVT 

GAA GCT AGA AGC TGC CAT CTT GCC ATG GCC CCG AAT CAT GGT GTG 180 0 
EARSCHLAMAPNHAV 

GTG TCT CGT ATG GAT AAG GTG GAA CGC TTG AAA CAG GTG TTG CTC 1845 
VSRMDKVERLKQVLL 

CAC CAA CAG GCT AAA TTT GGT AGA AAT GGA TCT GAC TGC CCG GAC 18 90 
H Q Q A K FGR N GS D C P D 

AAG TTT TGC TTA TTC CAG TCT GAA ACC AAA AAC CTT TTG TTC AAT 193 5 
K F C LF Q S E TKN L LF N 

GAC AAC ACT GAG TGT CTT GCC AGA CTC CAT GGC AAA ACA ACA TAT 1980 
DNTECLARLHG KTTY 

GAA AAA TAT TTG GGA CCA CAG TAT GTC GCA GGC ATT ACT AAT CTG 2025 
EKYLGPQYVAGITNL 




AAA AAG TGC TCA ACC TCC CCA CTC CTA GAA GCC TGT GAA TTC CTA " 2070 
KKCS TS PLLEACE FL 



AGG AAG TAA 
R K * 

(2) INFORMAZIONI SULLA SEQUENZA SEQ ID NO 

(i) CARATTERISTICHE DELLA SEQUENZA 

(A) LUNGHEZZA: 3 0 bp 

(B) TIPO: acido nucleico 

(C) NUMERO DI CATENE: singola 

(D) TIPOLOGIA: lineare 

(ii) TIPO DI MOLECOLA: oligonucleotide 
(ix) CARATTERISTICHE ULTERIORI 

(A) NOME:PLT46 
(xi) DESCRIZIONE DELLA SEQUENZA SEQ ID NO 

GGATCCATGG GCCGTAGGAG AAGGAGTGTT 

(3) INFORMAZIONI SULLA SEQUENZA SEQ ID NO 

(i) CARATTERISTICHE DELLA SEQUENZA 

(A) LUNGHEZZA: 32 bp 

(B) TIPO: acido nucleico 

(C) NUMERO DI CATENE: singola 

(D) TIPOLOGIA: lineare 

(ii) TIPO DI MOLECOLA: oligonucleotide 
(ix) CARATTERISTICHE ULTERIORI 

(A) NOME: PLT 47 
(xi) DESCRIZIONE DELLA SEQUENZA SEQ ID NO 
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GAGCTCCTTC GGTTTTACTT CCTGAGGAAT TC 32 

(4) INFORMAZIONI SULLA SEQUENZA SEQ ID NO: 4: 

(i) CARATTERI STI CHE DELLA SEQUENZA 

(A) LUNGHEZZA: 42 bp 

(B) TIPO: acido nucleico 

(C) NUMERO DI CATENE: singola 

(D) TIPOLOGIA: lineare 

(ii) TIPO DI MOLECOLA: oligonucleotide 
(ix) CARATTERI STI CHE ULTERIORI 

(A) NOME: PLT 48 
(xi) DESCRIZIONE DELLA SEQUENZA SEQ ID NO: 4: 

TCTAGATAAA ATAAT C TATA CATTAAAAAA TTTGATTTTA AA 42 

(5) INFORMAZIONI SULLA SEQUENZA SEQ ID NO: 5: 

(i) CARATTERI STI CHE DELLA SEQUENZA 

(A) LUNGHEZZA: 3 6 bp 

(B) TIPO: acido nucleico 

(C) NUMERO DI CATENE: singola 

(D) TIPOLOGIA: lineare 

(ii) TIPO DI MOLECOLA: oligonucleotide 
(ix) CARATTERI ST I CHE ULTERIORI 

(A) NOME: PLT 49 
(xi) DESCRIZIONE DELLA SEQUENZA SEQ ID NO: 5: 

GGATCCGACT GAGTCGGATA AGAAGAAAAG AAAAGA 36 



(6) INFORMAZIONI SULLA SEQUENZA SEQ ID NO : 6 

(i) CARATTERISTICHE DELLA SEQUENZA 

(A) LUNGHEZZA: 36 bp 

(B) TIPO: acido nucleico 

(C) NUMERO DI CATENE: singola 

(D) TIPOLOGIA: lineare 

(ii) TIPO DI MOLECOLA: oligonucleotide 
(ix) CARATTERISTICHE ULTERIORI 

(A) NOME: PLT 50 
(xi) DESCRIZIONE DELLA SEQUENZA SEQ ID NO: 6 

TCTAGAGTTT TCAAATTTGA ATTTTAATGT GTGTTG 

(7) INFORMAZIONI SULLA SEQUENZA SEQ ID NO: 7 

(i) CARATTERISTICHE DELLA SEQUENZA 

(A) LUNGHEZZA: 36 bp 

(B) TIPO: acido nucleico 

(C) NUMERO DI CATENE: singola 

(D) TIPOLOGIA: lineare 

(ii) TIPO DI MOLECOLA: oligonucleotide 
(ix) CARATTERISTICHE ULTERIORI 

(A) NOME: PLT 51 
(xi) DESCRIZIONE DELLA SEQUENZA SEQ ID NO: 7 

GGATCCCACC TTAAGGAGGT TGCAACGAGC GTGGCA 

(8) INFORMAZIONI SULLA SEQUENZA SEQ ID NO: 8: 
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(i) CARATTERI STI CHE DELLA SEQUENZA 

(A) LUNGHEZZA: 250 bp 

(B) TIPO: acido nucleico 

(C) NUMERO DI CATENE: singola 

(D) TIPOLOGIA: lineare 

(ii) TIPO DI MOLECOLA: oligonucleotide 
(ix) CARATTERI STI CHE ULTERIORI 

(A) NOME: PLT 120 
(xi) DESCRIZIONE DELLA SEQUENZA SEQ ID NO: 8: 



GGC 


CGT 


AGG 


AGA 


AGG 


AGT 


GTT 


CAA 


TGG 


TGC 


GCA 


GTA 


TCA 


CAA 


CCA 


GAG 


48 


GCC 


ACA 


AAA 


TGC 


TTC 


CAA 


TGG 


CAA 


AGG 


AAT 


ATG 


AGA 


AAA 


GTT 


CGT 


GGA 


96 


CCT 


CCT 


GTA 


TCT 


TGC 


ATA 


AAG 


AGA 


GAT 


TCA 


CCC 


ATC 


CAG 


TGT 


ATC 


CAG 


144 


GCA 


ATT 


GCG 


GAA 


AAC 


AGA 


GCT 


GAT 


GCT 


GTG 


ACT 


CTT 


GAT 


GGT 


GGT 


TTC 


192 


ATA 


TAC 


GAG 


GCA 


GGA 


CTT 


GCC 


CCA 


TAC 


AAA 


CTG 


CGA 


CCT 


GTA 


GCG 


GCG 


240 


GAA 


GTC 


TAC 


G 


























250 



(9) INFORMAZIONI SULLA SEQUENZA SEQ ID NO: 9: 
(i) CARATTERI STI CHE DELLA SEQUENZA 

(A) LUNGHEZZA: 250 bp 

(B) TIPO: acido nucleico 

(C) NUMERO DI CATENE: singola 



(ix) 



(ii) 



TIPO DI MOLECOLA: oligonucleotide 



CARATTERI STI CHE ULTERIORI 



(A) NOME: PLT 121 



(D) TIPOLOGIA: lineare 




(xi) 



DESCRIZIONE DELLA SEQUENZA SEQ ID NO : 9 : 
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GC ACC TGG AAC ACA AGA GGC TGA GAA 
AAT GGG CTC AGG TGG ACC CGT CCA ATT 
TAT AGG GAC ATT CCA TCC AGC GGT CCT 
CTT CAG ACC TTG AAG TTC GTT CAG CTG 
AAC AGC CAC AGC ATA ATA GTG AGT TCG 
GAC TTC CGC CG 



GAA 


TCT 


TGC 


CAC 


AGC 


TGC 


CTC 


47 


CAA 


GAA 


TGG 


ACG 


AAG 


TGT 


CCC 


95 


GCG 


AAG 


TCC 


TGT 


GTG 


GCA 


TGA 


143 


AAA 


AGA 


TCC 


GCC 


CTT 


CTT 


CAC 


191 


TGG 


TTG 


TCT 


TTC 


GGT 


CCC 


GTA 


239 



250 



(10) INFORMAZIONI SULLA SEQUENZA SEQ ID NO: 10: 
(i) CARATTERI STI CHE DELLA SEQUENZA 

(A) LUNGHEZZA: 253 bp 

(B) TIPO: acido nucleico 

(C) NUMERO DI CATENE: singola 

(D) TIPOLOGIA: lineare 

(11) TIPO DI MOLECOLA: oligonucleotide 
(ix) CARATTERI STICHE ULTERIORI 

(A) NOME: PLT 122 
(xi) DESCRIZIONE DELLA SEQUENZA SEQ ID NO: 10: 

AAC TGG CTT ACG AGT GTT GTC TGG GCA GAG TAA CTC ATA CTC GTC 45 
CCT TTC AGC CTC GTC TGA AAG ATC CTC AAA CAC TGT GCT CTC TCT 90 
AAT AAA AGC AAC ATC TCC AGC ACC GTC TCT AAG ACA CTT AAA GGC 135 
ACC AGA GTA GCT GAA GTA CGG TTC CTG GGA TGA GAA TGC ACA TTT 180 
GTT TTC CCC TGT CCC CGC ACA CAG GCG ACA AAG GTT GGG GAA TTG 225 
TCC TTT ATC TGC ACC TGG AAC ACA A 253 



(11) INFORMAZIONI SULLA SEQUENZA SEQ ID NO: 11: 
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(i) CARATTERI STI CHE DELLA SEQUENZA 

(A) LUNGHEZZA: 255 bp 

(B) TIPO: acido nucleico 

(C) NUMERO DI CATENE: singola 

(D) TIPOLOGIA: lineare 

(ii) TIPO DI MOLECOLA: oligonucleotide 
(ix) CARATTERI ST I CHE ULTERIORI 

(A) NOME: PLT 123 
(xi) DESCRIZIONE DELLA SEQUENZA SEQ ID NO:ll: 
GTA CAA CCC AGA ATC TAT CCT AGG TGG CAC TCT CGA AAA CCC AAT GGC 48 
AGA GTC CTT GAA CAG AAG ATC TTT CTG CCC ACT AGG GGA ACC AAA GAG 96 
CTG GAA TTT CGG TGA CTT GTC CTT TCC AAA CTT TTC CTG TGC TTG GCG 144 
GAG AAG ATT CCA GAT GGC ATC CTC CTT TCC ATT AAC ACT TCG TGC CAC 192 
AAC GGC ATG AGA AGG GAC CCG TGC AAG ATG GCA ATC TTT GAA CTT GTC 240 
AAC TGG CTT ACG AGT 255 

(12) INFORMAZIONI SULLA SEQUENZA SEQ ID NO: 12: 

(i) CARATTERI STI CHE DELLA SEQUENZA 

(A) LUNGHEZZA: 251 bp 

(B) TIPO: acido nucleico 

(C) NUMERO DI CATENE: singola 

(D) TIPOLOGIA: lineare 

(ii) TIPO DI MOLECOLA: oligonucleotide 



(ix) 



CARATTERI ST I CHE ULTERIORI 



(A) NOME: PLT 124 



{xi) DESCRIZIONE DELLA SEQUENZA SEQ ID NO:12: 

TA TCC TCC ATC CAA ACT CAT GGC ATC AGC TTC TCC TTT CAA CAC CAG 47 

GGC GAT GCA ATC TTC TGT AGT GGA GGC CGA TGA GCA GGT CAC AGA TCC 95 

TTC GCT CAA ACC ACT CCA CTG GTT ACA CTT GCG CAA CTC TTG CTC TCC 143 

CAC CGC ACA CCA AAC GAC CCG CGC ACG CCG GGC AGC AAC TTC CTC CTC 191 

ACT TTT CCT CAA GTT CTG AAT TGC AGT AAA GTA TCC GGA GCC AAG GTA 239 
CAA CCC AGA ATC 251 

(13) INFORMAZIONI SULLA SEQUENZA SEQ ID NO: 13: 

(i) CARATTERISTICHE DELLA SEQUENZA 

(A) LUNGHEZZA: 75 bp 

(B) TIPO: acido nucleico 

(C) NUMERO DI CATENE: doppia 

(D) TIPOLOGIA: lineare 

(ii) TIPO DI MOLECOLA: oligonucleotide 
(ix) CARATTERISTICHE ULTERIOR I 

(D) ALTRE INFORMAZIONI: sequenza "leader" 
della proteina globulina basica 7S 
(xi) DESCRIZIONE DELLA SEQUENZA SEQ ID NO:13: 
ATGGCTTCTA TCCTCCACTA CTTTTTAGCC CTCTCTCTTT CTTGCTCTTT 50 
TCTTTTCTTC TTATCCGACT CAGTC 75 

(14) INFORMAZIONI SULLA SEQUENZA SEQ ID NO: 14: 
(i) CARATTERISTICHE DELLA SEQUENZA 

(A) LUNGHEZZA: 191 bp 



(B) TIPO: acido nucleico 

(C) NUMERO DI CATENE: doppia 

(D) TIPOLOGIA: lineare 

(ii) TIPO DI MOLECOLA: oligonucleotide 
(ix) CARATTERISTICHE ULTERIOR I 

(D) ALTRE INFORMAZIONI : sequenza "leader" 
della proteina (3-conglicinina 

(xi) DESCRIZIONE DELLA SEQUENZA SEQ ID NO: 14: 
ATGATGAGAG CGCGGTTCCC ATTACTGTTG CTGGGAGTTG TTTTCCTAGC 50 
AT CAGTTTCT GTCTCATTTG GCATTGCGTA TTGGGAAAAG CAGAACCCCA 10 0 
GTCACAACAA GTGCCTCCGA AGTTGCAATA GCGAGAAAGA CTCCTACAGG 150 
AACCAAGCAT GCCACGCTCG TTGCAACCTC CTTAAGGTG 189 

(15) INFORMAZIONI SULLA SEQUENZA SEQ ID NO: 15: 

(i) CARATTERISTICHE DELLA SEQUENZA 

(A) LUNGHEZZA : 250 bp 

(B) TIPO: acido nucleico 

(C) NUMERO DI CATENE: singola 

(D) TIPOLOGIA: lineare 

(ii) TIPO DI MOLECOLA: oligonucleotide 
(ix) CARATTERISTICHE ULTERIORI 

(A) NOME: PLT 12 5 
(xi) DESCRIZIONE DELLA SEQUENZA SEQ ID NO: 15: 
GAGCAATCCC ATGGGGATAT TCCAACCTGC AGTCCTGTCC ACGGCGGTGT 50 
GGCAGGACTT CTTGCCTTTC ACAGAGTTCC AGGTAAGGCT AGTGTCTGAT 100 





CTCCTAACCA CCGCCACAGC AAGATATCCT TCCACAGGTC TATCCACACA 150 
GTTAGGATCA GGGTCACTGC TTTGTTGTGA TTTGTAGTTC TCTGCAAGAC 200 
AGGCACCAAA CCACATTTAC CTGGAGTGTA AACATATCCT CCATCCAAAC 250 

(16) INFORMAZIONI SULLA SEQUENZA SEQ ID NO: 16: 

(i) CARATTERI STI CHE DELLA SEQUENZA 

(A) LUNGHEZZA: 254 bp 

(B) TIPO: acido nucleico 

(C) NUMERO DI CATENE: singola 

(D) TIPOLOGIA: lineare 

(ii) TIPO DI MOLECOLA: oligonucleotide 
(ix) CARATTERI STI CHE ULTERIORI 

(A) NOME: PLT 12 6 
(xi) DESCRIZIONE DELLA SEQUENZA SEQ ID NO: 16: 
C CAT CAGTGT TCTGCAAGAC AGTGACATCT TTCACAAATG CAACGTCTCC 50 
AGCATTCTCA GCCAAGCAAC GGAAAGCCCC AGTGTAACCG TAGTATCTCT 100 
CGTTGCTGTT GGGAACGCAC TTATTCTCAC CTTGCTCATC TCCAATACAC 150 
AAAGCACAGA GATTAGATCT TGGGTCAGAA CCAGGGGCAC AGCTTTGACT 200 
GAAATATTCA TCAAATTTGC AGGAGCCCGT CTGGTTGAAG AGCAAGCCCA 250 
TGGG 254 

(17) INFORMAZIONI SULLA SEQUENZA SEQ ID NO: 17: 
(i) CARATTERI STICHE DELLA SEQUENZA 

(A) LUNGHEZZA: 22 9 bp 

(B) TIPO: acido nucleico 

(C) NUMERO DI CATENE: singola 
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(D) TIPOLOGIA: lineare 
(ii) TIPO DI MOLECOLiA : oligonucleotide 
(ix) CARATTERISTICHE ULTERIORI 

(A) NOME: PLT 127 
(xi) DESCRIZIONE DELIA SEQUENZA SEQ ID NO: 17: 
GCAGTCAGAT CCATTTCTAC CAAAT T T AGC CTGTTGGTGG AGCAACACCT 50 
GTTTCAAGCG TTCCACCTTA TCCATACGAG ACACCACAGC ATGATTCGGG 100 
GCCATGGCAA GATGGCAGCT TCTAGCTTCA GTCACAGGCT TACGTTTGCC 150 
ATCGAGGCAC AGCAACGCAA AGTCTGCAAG CTTCAAATCC TTAGCCCATG 200 
CCTCATTGTT ATTTCCATCA GTGTTCTGC 229 
(18) INFORMAZIONI SULLA SEQUENZA SEQ ID NO: 18: 

(i) CARATTERISTICHE DELIA SEQUENZA 

(A) LUNGHEZZA: 210 bp 

(B) TIPO: acido nucleico 

(C) NUMERO DI CATENE: singola 

(D) TIPOLOGIA: lineare 

(ii) TIPO DI MOLECOLA: oligonucleotide 
(ix) CARATTERISTICHE ULTERIORI 

(A) NOME: PLT 128 
(xi) DESCRIZIONE DELLA SEQUENZA SEQ ID NO: 18: 
TTACTTCCTT AGGAATTCAC AGGCTTCTAG GAGTGGGGAG GTTGAGCACT 50 . 
TTTTCAGATT AGTAATGCCT GCGACATACT GTGGTCCCAA ATATTTTTCA 100 
TATGTTGTTT TGCCATGGAG TCTGGCAAGA CACTCAGTGT TGT CATTGAA 150 
CAAAAGGTTT TTGGTTTCAG ACTGGAATAA GCAAAACTTG TCCGGGCAGT 200 
CAGATCCATT 210 



(19) INFORMAZIONI SULLA SEQUENZA SEQ ID NO: 19 

(i) CARATTERI STICHE DELLA SEQUENZA 

(A) LUNGHEZZA: 30 bp 

(B) TIPO: acido nucleico 

(C) NUMERO DI CATENE: singola 

(D) TIPOLOGIA: lineare 

(ii) TIPO DI MOLE COLA : oligonucleotide 
(ix) CARATTERI STICHE ULTERIORI 

(A) NOME: PLT 129 
(xi) DESCRIZIONE DELLA SEQUENZA SEQ ID NO: 19: 

GGATCCATGG GCCGTAGGAG AAGGAGTGTT 

(20) INFORMAZIONI SULLA SEQUENZA SEQ ID NO: 20 

(i) CARATTERI STICHE DELLA SEQUENZA 

(A) LUNGHEZZA: 28 bp 

(B) TIPO: acido nucleico 

(C) NUMERO DI CATENE: singola 

(D) TIPOLOGIA: lineare 

(ii) TIPO DI MOLECOLA: oligonucleotide 
(ix) CARATTERI STICHE ULTERIORI 

(A) NOME: PLT 120 
(xi) DESCRIZIONE DELLA SEQUENZA SEQ ID NO:20: 
GAGCTCTTAC TTCCTTAGGA ATTCACAG 

(21) INFORMAZIONI SULLA SEQUENZA SEQ ID NO: 21 
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(i) CARATTERI STI CHE DELLA SEQUENZA 

(A) LUNGHEZZA: 1367 bp 

(B) TIPO: acido nucleico 

(C) NUMERO DI CATENE: doppia 

(D) TIPOLOGIA: lineare 

(ii) TIPO DI MOLECOLA: DNA 
(ix) CARATTERI STI CHE ULTERIORI 




V 



50 



(D) ALTRE INFORMAZIONI : sequenza del promotore 
del gene codifocante per la globulina basica 7S 
(xi) DESCRIZIONE DELLA SEQUENZA SEQ ID NO:21: 
TAAAATAATC TAT AC AT T AA AAAATTTGAT TTTAAAATTT TAGAAATTCA 

TGATTTTATT TTTTTTTACC AGAAATCCGT TAATATTGTT AAAATATTAC 100 

CAACTAATTT ATAAATTTTA TTTTAAGGCA ATTAAGCATG TTTGATAAAA 150 

TATATATATT GTTATAAATA CTTTTCAAAA GTATAAAGTT GATGATGGCG 200 

TGGTGGTAGA TTATTTTAGT TCTAGGTTCG AATGCAAGTT GGTTTAGACA 250 

TTTAGCCTTA TTCTTTTT tc TAACCAAAAT AAATGTAAAT GGAAAACCTT 300 

TAGGAAAAAA AAGAAAT C AA AATTGAAAAC ATCATCCGGT GGAGTCGAGA 350 

AGCCCACACC CACGTGACCC AACAATATTA AAATAAGAGT TTGCTCTACA 400 

GTAAATGCGA TACTTTTTTA TTCAATACTT TTTCCACTTC TAAAATCTTG 450 

GAGATTTGCA CCGTTAACTA ATTAAGTGTT ATATCCAACG GTCCTAAAAA 500 

AACTTGTGTA CCGTGCCTCA CATTTCAACT TTGCGCACCC TGAAAGCCGT 550 

TATGTTTAGG TTAGTGTTTG CAACAGTTGA AGCGCATCAC T C AGGAGGCT 600 

ACTTGGT CTT GCTTTTGCGT CTTTTGTTCA ATTTTTCACG TGATTTTGTT 650 

GGTGAACACG CGTACTTGAA ACTTATTATA AATTACATAA TTTTATAAGT 700 

TTCACTTCTT ATATAATACT CATATAATAT ATAGGGTTTA GAATGCCAAT 750 





w 
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* 


TTTTAAAAAA 


AGAATAAAAA 


AATAAATAGA 


ATAAAATCGA 


AAAAATGAAA 


800 


TGTAAAAAAT 


TTGAGGGGGA 


CAAATAAAAT 


ATGAAAGTCT 


ATTATTTAAA 


850 


TTTTCCATTA 


GAATTCTATT 


TTCCTTAGTT 


AATATGAGCT 


AGCCAGTTGG 


900 


GAG AT A CACG 


AAAATGTCAT 


GAAACAGTTG 


CATGTAGGGA 


AATTAATGTA 


950 


GTAGAGGGAT 


AGCAAGACAA 


AAATCCAAGC 


CAAGCTAGCT 


GCTCACGCGA 


1000 


ACTCGATCCA 


CACGTCCTTT 


ACAGAGTTTC 


AAACGGATGA 


AATCTGCATG 


1050 


GCATGCAACT 


AAAGCATTGT 


TCTCAGCTGC 


CAAGTACCCC 


TCACACTCAC 


1100 


CAACCCTTTG 


TTTTTCTCCC 


CATTGCATGT 


TAACTCAAGT 


TTATCCTTTC 


1150 


TTTGCTTCTG 


GAAATTTCAC 


AAGCCTCAAA 


CACGTCGACG 


TCCAATCTTG 


1200 


TGACCAACAC 


GGCCAAAAGA 


AAAGAG AAT C 


TCATCCCGTT 


CACACTTAGC 


1250 


CACTTAAAGC 


TAGCCAAACG 


GTGATCTTTC 


TCTATATATT 


GTAGCTCTCT 


1300 


AACACAACCA 


ACACTACCAT 


TATTCAATAT 


TCAAACCTTG 


CTCTATACTA 


1350 


CACACAv- 1 AU 


AA<jAAl A 
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(22) INFORMAZIONI SULLA SEQUENZA SEQ ID NO: 22: 

(i) CARATTERI STICHE DELLA SEQUENZA 

(A) LUNGHEZZA: 962 bp 

(B) TIPO: acido nucleico 

(C) NUMERO DI CATENE: doppia 

(D) TIPOLOGIA: lineare 

(ii) TIPO DI MOLECOLA: DNA 
(ix) CARATTERI STICHE ULTERIORI 

(D) ALTRE INFORMAZIONI: sequenza del promotore 
del gene codifocante per la p-conglicinina 
(xi) DESCRIZIONE DELLA SEQUENZA SEQ ID NO: 22: 
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GTTTTCAAAT TTGAATTTTA ATGTGTGTTG TAAGTATAAA TTTAAAATAA 50 
AAATAAAAAC AATTATTATA TCAAAATGGC AAAAACATTT AATACGTATT 100 
ATTTATTAAA AAAATATGTA ATAATATATT TATATTTTAA TATCTATTCT 150 
TATGTATTTT TTAAAAATCT ATTATATATT GATCAACTAA AATATTTTTA 2 00 
TATCTACACT TATTTTGCAT TTTTATCAAT TTTCTTGCGT TTTTTGGCAT 250 
ATTTAATAAT GACTATTCTT TAATAATCAA TCATTATTCT TACATGGTAC 300 
ATATTGTTGG AACCATATGA AGTGTTCATT GCATTTGACT ATGTGGATAG 350 
TGTTTTGATC CATGCCCTTC ATTTGCCGCT ATTAATTAAT TTGGTAACAG 4 00 
ATTCGTTCTA ATCAGTTAOT TAATCCTTCC TCATCATAAT TAAT CTGGTA 450 
GTTCGAATGC CATAATATTG ATTAGTTTTT TGGACCATAA GAAAAAGCCA 500 
AGGAACAAAA GAAGACAAAA CACAATGAGA GTATCCTTTG CATAGCAATG 550 
TCTAAGTTCA TAAAATT CAA ACAAAAACGC AATCACACAC AGTGGACATC 60 0 
ACTTATCCAC TAGCTGATCA GGATCGCCGC GTCAAGAAAA AAAAACTGGA 650 
CCCCAAAAGC CATGCACAAC AACACGTACT CACAAAGGCG TCAAT CGAGC 700 
AGCCCAAAAC ATTCACCAAC TCAACCCATC ATGAGCCCAC ACATTTGTTG 750 
TTTCTAACCC AACCTCAAAC TCGTATTCTC TTCCGCCACC TCATTTTTGT 80 0 
TTATTTCAAC ACCCGTCAAA CTGCATCCCA CCCCGTGGCC AAATGTTCAT 850 
GCATGTTAAC AAGACCTATG ACTATAAATA TCTGCAATCT CGGCCCAAGT 900 
TTT CATCATC AAGAACCAGT TCAATATCCT AGTACGCCGT ATTAAAGAAT 950 
TTAAGATATA CT 962 




R M 



RIVENDICAZIONI 



1 . 



Polinucleotide 



codif icante 



per 



la 



lattoferrina umana, caratterizzato dal fatto di 
avere una sequenza totalmente o parzialmente 
corrispondente alia sequenza riportata come SEQ ID 
NO:l, e dal fatto che detta sequenza e ottimizzata 
per la espressione in pianta. 

2. Polinucleotide secondo la rivendicazione 1, 
detto polinucleotide presentando fusa alia parte 5' 
terminal e una sequenza seel t a dal gruppo 
comprendente le sequenze riportate come SEQ ID NO: 
13 e NO: 14. 

3. Lattoferrina umana, caratterizzata dal 
fatto di essere ottenuta dalla espressione di un 
polinucleotide secondo la rivendicazione 1 oppure 
2 . 

4 . Vettore di DNA ricombinante caratterizzato 
dal fatto di comprendere almeno una sequenza 
codificante per un gene di interesse operativamente 
collegata ad elementi di regolazione che ne 
consentono la espressione tessuto specif ica. 

5. Vettore secondo la rivendicazione 4, detti 
elementi di regolazione essendo costituiti da una 
"cassetta di espressione per piante" che consente 




la espressione tessuto specifica di det-to gene di 
interesse. 

6. Vettore secondo la rivendicazione 5, in cui 
detta cassetta di espressione per piante e 
costituita dagli element i di regolazione del gene 
codificante per la proteina Globulina basica 7 S. 

7. Vettore secondo la rivendicazione 6, in cui 
la sequenza del promotore e la sequenza riportata 
come SEQ ID NO: 21 

8. Vettore secondo la rivendicazione 5, in cui 
detta cassetta di espressione per piante e 
costituita dagli elementi di regolazione del gene 
codificante per la proteina p-conglicinina . 

9. Vettore secondo la rivendicazione 8, in cui 
la sequenza del promotore e la sequenza riportata 
come SEQ ID NO: 22. 

10. Vettore secondo una qualsiasi delle 
rivendicazioni da 4 a 9, in cui la sequenza del 
gene di interesse e operativamente collegata ad una 
sequenza "leader" . 

11. Vettore secondo la rivendicazione 10, 
detta sequenza "leader" essendo fusa alia sequenza 
codificante per il gene di interesse. . 

12. Vettore secondo la rivendicazione \i0 
oppure 11, detta sequenza leader essendo scelta dkl. 




gruppo comprendente le sequenze secondo la 
rivendicazione 2 . 

13. Vettore secondo una qualsiasi delle 
rivendicazioni da 4 a 12, in cui detto gene di 
interesse e il gene della lattoferrina umana. 

14 . Vettore di DNA ricombinante secondo la 
rivendicazione 13, detta sequenza essendo la 
sequenza secondo la rivendicazione 1 . 

15. Vettore secondo una qualsiasi delle 
rivendicazioni da 4 a 14, detto vettore essendo un 
plasmide. 

16. Vettore secondo la rivendicazione 15, 
detto plasmide essendo seel to dal gruppo 
comprendente pUC, pGEM e pBI . 

17. Procedimento di trasf ormazione di cellule 
vegetali caratterizzato dal fatto che detta 
trasformazione e effettuata con un vettore secondo 
una qualsiasi delle rivendicazioni da 4 a 16. 

18. Cellule vegetali transgeniche 
caratterizzate dal fatto di essere ottenibili 
tramite trasformazione di cellule vegetali di tipo 
selvatico con un vettore secondo una qualsiasi 
delle rivendicazioni da 4 a 16. 

19. Cellule vegetali transgeniche 
caratterizzate dal fatto di contenere un gene di 




interesse operativamente collegato in una "cassetta 
di espressione" che consente la espressione tessuto 
specifica di detto gene. 

20. Cellule vegetali transgeniche secondo la 
rivendicazione 19, detto gene di interesse essendo 
quello codificante per la lattoferrina umana. 

21. Cellule vegetali transgeniche secondo la 
rivendicazione 20, detto gene codificante per la 
lattoferrina umana avendo una seguenza 
corrispondente a quel la secondo la rivendicazione 
1. 

23. Cellule vegetali transgeniche secondo una 
qualsiasi delle rivendicazioni da 19 a 21, in cui 
detta cassetta di espressione comprende la regione 
di regolazione del gene codificante per la 
Globulina basica 7S. 

24. Cellule vegetali transgeniche secondo una 
qualsiasi delle rivendicazioni da 19 a 21/ in cui 
detta cassetta di espressione comprende la regione 
di regolazione del gene codifcante per la p- 
conglicinina . 

25. "Aggregati cellulari" caratterizzati " dal 
fatto di essere ottenibili dalle cellule secondo 
una qualsiasi delle rivendicazioni da 18 a 24. 

26. "Aggregati cellulari" secondo la 




rivendicazione 2 5 , detti aggregati essendo calli in 
grado di rigenerare piante transgeniche . 

27. Piante transgeniche caratterizzate dal 
fatto di essere ottenibili dalle cellule secondo 
una qualsiasi delle rivendicazioni da 18 a 24, 
tramite tecniche convenzionali . 

28. Piante transgeniche caratterizzate dal 
fatto di contenere un gene di interesse 
operativamente collegato in una "cassetta di 
espressione" che consente la espressione tessuto 
specif ica di detto gene di interesse. 

29. Piante transgeniche secondo la 
rivendicazione 28, detto gene di interesse essendo 
quello codificante per la lattoferrina umana. 

30. Piante transgeniche secondo la 
rivendicazione 29, detto gene codificante per la 
lattoferrina umana avendo una sequenza 
corrispondente a alia sequenza di cui alia 
rivendicazione 1. 

31. Piante transgeniche secondo una qualsiasi 
delle rivendicazioni da 27 a 30, dette piante 
essendo scelte dal gruppo comprendente solanacee, 
cereali, leguminose, piante da frutto e orticole. 

32 . Pianta transgenica secondo la 
rivendicazione 31, detta pianta essendo la soia. 




33. Pianta transgenica secondo la 
rivendicazione 31, detta pianta essendo il tabacco. 

34. Pianta transgenica secondo la 
rivendicazione 31, detta pianta essendo il riso. 

35. Piante transgeniche secondo una qualsiasi 
delle rivendicazioni da 27 a 34, detto gene essendo 
espresso specif icamente nei tessuti di riserva. 

36. Piante transgeniche secondo la 
rivendicazione 35, detti tessuti di riserva essendo 
quelli del frutto. 

37. Uso di piante transgeniche secondo una 
qualsiasi delle rivendicazioni da 27 a 36, come 
nutri ceu ti cal s . 

38. Procedimenti di produzione di cibi 
funzionali contenenti proteine prodotte dalle 
piante, caratterizzati dal fatto di utilizzare le 
piante secondo una qualsiasi delle rivendicazioni 
da 27 a 36. 

39. Procedimenti di produzione di cibi 
funzionali secondo la rivendicazione 38, detti 
procedimenti essendo finalizzati alia produzione di 
latti vegetali, succhi di frutta, omogeneizzati di 
frutta e/o omogenizzati di verdura. 

40. Procedimenti di produzione di latti 
vegetali, a part ire da proteine in forma natural 
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e/o in concentrate caratterizzati dal fatto di 
utilizzare proteine derivate da piante transgeniche 
secondo una qualsiasi delle rivendicazioni da 27 a 
36. 

41. Procedimento di produzione di lattoferrina 
umana, caratterizzato dal fatto di utilizzare 
piante transgeniche secondo una qualsiasi delle 
rivendicazioni da 27 a 36. 

42. Lattoferrina umana caratterizzata dal 
fatto di essere ottenuta da piante transgeniche 
secondo una qualsiasi delle rivendicazioni da 27 a 
36. 
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FIGURA 1 : Strategia di assemblaggio del gene sintetico per la lattoferrina umana utilizzando 
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